專利名稱:對象檢測設(shè)備、學習設(shè)備、對象檢測方法和程序的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及對象檢測設(shè)備,并且具體地涉及從圖像檢測如人的面部的對象的對象
檢測設(shè)備、創(chuàng)建用于其檢測的數(shù)據(jù)的學習設(shè)備、及其處理方法和使得計算機執(zhí)行這樣的方法的程序。
背景技術(shù):
迄今,已經(jīng)提出了識別成像的圖像中包括什么被攝體(subject)的被攝體識別技術(shù),所述成像的圖像通過如數(shù)字照相機、數(shù)字攝像機(例如,集成了相機的記錄器)等生成。例如,作為被攝體識別技術(shù),已經(jīng)提出了一種面部檢測技術(shù),用于使用如亮度、顏色等的特征量通過成像處理從成像的圖像中檢測人的面部。 例如,基于圖像上的兩點之間的亮度的差值是否是閾值或更大,確定加權(quán)多數(shù)值(weighted majorityvalue),并且對兩點的每個組合將該加權(quán)多數(shù)值順序相加,從而計算評估值。提出了一種對象檢測設(shè)備,其基于計算的評估值確定對象是否包括在其圖像中(例如,參見日本未審專利申請公開第2005-157679號(圖l))。
發(fā)明內(nèi)容
在如上所述的現(xiàn)有技術(shù)的情況下,通過學習設(shè)備預先獲得圖像上的兩點的組合以及加權(quán)多數(shù)表決值和閾值的組合,并且將它們相關(guān)并存儲。根據(jù)所確定的對象圖像上的兩點之間的亮度的差值是否等于或大于閾值,確定對應于兩點的加權(quán)多數(shù)的正/負符號,并且對于兩點的每個組合,通過將具有所確定的符號的加權(quán)多數(shù)值順序相加來計算評估值。
在用學習設(shè)備計算用于在對象和非對象之間進行區(qū)分的加權(quán)多數(shù)值的情況下,對包括對象或非對象的多個樣本圖像上的兩點的每個組合創(chuàng)建所述兩點之間的亮度的差值的分布信息。利用該分布信息,例如可以看到,示出包括對象的樣本圖像上的兩點之間的亮度的差值的分布狀態(tài)的分布曲線的第一鐘形曲線(bell)、以及示出包括非對象的樣本圖像上的兩點之間的亮度的差值的分布狀態(tài)的分布曲線的第二鐘形曲線。 例如,對于在對應于對象的分布曲線的第一鐘形曲線和對應于非對象的分布曲線的第二鐘形曲線相距相對遠的情況下通過學習設(shè)備計算的加權(quán)多數(shù)值,可以認為相對可靠度高。相反,對于在對應于對象的分布曲線的第一鐘形曲線和對應于非對象的分布曲線的第二鐘形曲線較大地重疊的情況下通過學習設(shè)備計算的加權(quán)多數(shù)值,可以認為相對可靠度低。 然而,例如,即使在對應于對象的分布曲線的第一鐘形曲線和對應于非對象的分布曲線的第二鐘形曲線較大地重疊的情況下,在某種范圍內(nèi)也可能存在特征。例如,在一定范圍內(nèi),兩個鐘形曲線較大地重疊,沒有特征分布改變,并且對象和非對象之間的區(qū)分是困難的(即,可靠度低)。相反,在另一范圍內(nèi),兩個鐘形曲線中的一個鐘形曲線可能分布為支配性的,從而將兩者區(qū)分開來是容易的(例如,可靠度高)。 因此,為了改進對象的檢測精度,在包括對象或非對象的多個樣本圖像中根據(jù)特征量分布值的分布信息設(shè)置適當?shù)募訖?quán)多數(shù)值變得重要。
已經(jīng)認識到需要改進對象的檢測精度。 根據(jù)本發(fā)明實施例,提供了一種對象檢測設(shè)備、其處理方法和使得計算機執(zhí)行該方法的程序,該對象檢測設(shè)備包括比較單元,用于提取確定對象圖像上的兩個區(qū)域的特征量,并基于提取的兩個特征量的特征量與閾值進行比較;以及計算單元,用于根據(jù)所述比較結(jié)果選擇具有不同絕對值的兩個值之一,并且通過用選擇的值執(zhí)行計算,計算用于確定對象是否包括在所述確定對象圖像中的評估值。 這用來提取確定對象上的兩個區(qū)域的特征量,并將提取的兩個特征量與閾值進行
比較,根據(jù)所述比較結(jié)果選擇兩個值之一,并且對選擇的值執(zhí)行計算,從而計算評估值。
所述對象檢測設(shè)備還可包括確定信息存儲單元,用于存儲包括所述確定對象圖
像上的兩個位置、所述閾值和所述兩個值的多個組合的確定信息,其中所述比較單元對每
個所述組合比較由所述兩個位置標識的所述確定對象圖像上的對兩個區(qū)域的兩個提取的
特征量與所述閾值;并且其中所述計算單元根據(jù)所述比較結(jié)果選擇所述兩個值之一,并且
通過順序執(zhí)行所選擇的值的計算來計算所述評估值。 這用來比較基于對確定對象圖像中的兩個區(qū)域提取的兩個特征量的特征量和每個組合的閾值,依賴于比較結(jié)果選擇每個組合的兩個值之一,并對選擇的值順序執(zhí)行計算,從而計算評估值。 對于每個所述對象,所述計算單元可計算評估值,以便對于每個所述對象選擇與多個對象的每個相關(guān)的所述兩個值之一,并且對每個所述對象執(zhí)行對每個對象選擇的值的計算,從而確定所述多個對象之一是否包括在所述確定對象圖像中。 這用來依賴于比較結(jié)果選擇對于多個對象的每個相關(guān)的兩個值之一,并且對每個對象執(zhí)行為每個對象選擇的值的計算,從而計算每個對象的評估值。 所述對象檢測設(shè)備還可包括確定信息存儲單元,用于存儲包括所述確定對象圖像上的兩個位置、所述閾值和與所述多個對象的每個相關(guān)的所述兩個值的多個組合的確定信息,其中對于每個所述組合,所述比較單元比較通過所述兩個位置標識的所述確定對象圖像上的對兩個區(qū)域的兩個提取的特征量與所述閾值,并且其中所述計算單元計算每個所述對象的所述多個組合的、對每個所述對象選擇的值,從而計算每個所述對象的所述評估值。 這用來比較對確定對象圖像上的對兩個區(qū)域的兩個提取的特征量和每個組合的閾值,并且對每個對象執(zhí)行為每個對象選擇的值的計算,從而計算每個對象的評估值。
此外,所述特征量可以是所述確定對象圖像上的兩點的位置處的亮度值,并且其中所述比較單元計算所述兩個提取的亮度值之間的差值,并且比較所述差值和所述閾值。
這用來計算對確定對象圖像中的兩個區(qū)域提取的兩個亮度值的差值,并比較所述差值與閾值。 此外,利用本發(fā)明實施例,提供了一種學習設(shè)備、其處理方法和使得計算機執(zhí)行該方法的程序,該學習設(shè)備包括加權(quán)單元,用于對包括對象和非對象之一的多個學習對象圖像加權(quán);差值計算單元,用于對每個所述學習對象圖像,提取所述學習對象圖像上的兩個區(qū)域的特征量,并且對所述學習對象圖像上的兩個區(qū)域的每個組合計算所述兩個提取的特征量的差值;分布信息創(chuàng)建單元,用于對包括所述對象的每個學習對象圖像和包括所述非對象的每個學習對象圖像的每個所述組合創(chuàng)建分布信息,所述分布信息示出對所述學習對象圖像加權(quán)的權(quán)重相對于所述計算的差值的分布狀態(tài);確定單元,用于基于作為對包括所述對象的學習對象圖像創(chuàng)建的分布信息的對象分布信息、和作為對包括所述非對象的學習對象創(chuàng)建的分布信息的非對象分布信息,確定在計算用于確定是否包括所述對象的評估值的情況下使用的每個組合中的一個組合、以及與關(guān)于所述組合的所述差值相對應的閾值;以及加權(quán)計算單元,用于基于與高于和低于所確定的閾值的兩個范圍中的較低范圍中包括的所確定的組合有關(guān)的所述對象分布信息和所述非對象分布信息、和與在所述兩個范圍中的較高范圍中包括的所確定的組合有關(guān)的所述對象分布信息和所述非對象分布信息,計算在計算所述評估值的情況下使用的值,作為其中根據(jù)所述兩個范圍而絕對值不同的兩個值。
這用來對每個學習對象圖像的每個組合計算所述學習對象圖像上的對兩個區(qū)域的兩個提取的特征量的差值,對包括對象的每個學習對象圖像和包括非對象的每個學習對象圖像的每個組合創(chuàng)建分布信息,基于對象分布信息和非對象分布信息,確定在計算評估值的情況下使用的組合和閾值,并且基于與低于所確定的閾值的范圍中包括的組合有關(guān)的所述對象分布信息和所述非對象分布信息、和與高于所確定的閾值的范圍中包括的組合有關(guān)的所述對象分布信息和所述非對象分布信息,計算所述值作為依賴于兩個范圍、具有不同絕對值的兩個值。 此外,所述確定單元可基于高于和低于標準值的兩個范圍中的較低范圍中包括的所述對象分布信息和所述非對象分布信息、和高于和低于所述標準值的兩個范圍中的較高范圍中包括的所述對象分布信息和所述非對象分布信息,確定所述組合和所述閾值,其中對應于所述差值的級別的一個值是標準值。 這用來基于高于和低于標準值的兩個范圍中的較低范圍中包括的所述對象分布信息和所述非對象分布信息、和較高范圍中包括的所述對象分布信息和所述非對象分布信息,確定組合和閾值。 此外,所述加權(quán)單元可依賴于所述學習對象圖像與所述兩個范圍中的較低范圍相聯(lián)系還是與較高范圍相聯(lián)系,對每個所述學習對象圖像選擇所計算的兩個值之一,并且使用對每個學習對象圖像選擇的值來計算和更新每個所述學習對象圖像的權(quán)重。 這用來依賴于所述學習對象圖像與所述較低范圍相聯(lián)系還是與較高范圍相聯(lián)系,對每個所述學習對象圖像選擇兩個值之一,并且使用對每個學習對象圖像選擇的值來計算和更新每個學習對象圖像的權(quán)重。 此外,所述對象可由相互不同的第一對象和第二對象組成;其中,所述分布信息創(chuàng)建單元可對包括所述第一對象的學習對象圖像和包括所述第二對象的學習對象圖像以及包括所述非對象的學習對象圖像的每個組合,創(chuàng)建所述分布信息;其中,所述確定單元可基于作為對包括所述第一對象的學習對象圖像創(chuàng)建的分布信息的第一對象分布信息、作為對包括所述第二對象的學習對象圖像創(chuàng)建的分布信息的第二對象分布信息、以及所述非對象分布信息,確定在計算用于確定是否包括所述第一對象和所述第二對象之一的評估值的情況下使用的所述每個組合中的所述組合之一、和關(guān)于所述組合的所述閾值;并且其中所述加權(quán)計算單元可基于與高于和低于所確定的閾值的兩個范圍中的較低范圍中包括的所確定的組合有關(guān)的所述第一對象分布信息和所述第二對象分布信息以及所述非對象分布信息的各種信息、以及與所述兩個范圍中的較高范圍中包括的所確定的組合有關(guān)的所述第
6一對象分布信息和所述第二對象分布信息以及所述非對象分布信息的各種信息,計算所述 第一對象和所述第二對象的每個的值,用作其中絕對值依賴于所述兩個范圍而不同的兩個 值。 這用來對包括所述第一對象的學習對象圖像、包括所述第二對象的學習對象圖像 以及包括所述非對象的學習對象圖像的每個組合,創(chuàng)建分布信息,并且基于第一對象分布 信息、第二對象分布信息以及所述非對象分布信息,確定在評估值的情況下使用的組合和 閾值,并且基于與低于所確定的閾值的范圍中包括的組合有關(guān)的所述第一對象分布信息和 所述第二對象分布信息以及所述非對象分布信息的各種信息、以及與高于所確定的閾值的 范圍中包括的組合有關(guān)的所述第一對象分布信息和所述第二對象分布信息以及所述非對 象分布信息的各種信息,將所述第一對象和所述第二對象的每個的所述值計算為根據(jù)兩個 范圍而具有不同絕對值的兩個值。 根據(jù)上述配置,可獲得改進對象的檢測精度的出色的優(yōu)點。
圖1是圖示根據(jù)本發(fā)明第一實施例的成像設(shè)備的功能配置示例的框圖; 圖2是圖示根據(jù)本發(fā)明第一實施例的相機控制單元的功能配置示例的框圖; 圖3是圖示根據(jù)本發(fā)明第一實施例的面部檢測單元的功能配置示例的框圖; 圖4是圖示根據(jù)本發(fā)明第一實施例的學習設(shè)備的功能配置示例的框圖; 圖5A和5B是圖示根據(jù)本發(fā)明第一實施例的、用作學習設(shè)備的學習對象的學習對
象圖像的示例的圖; 圖6A和6B是示意性圖示根據(jù)本發(fā)明第一實施例的權(quán)重保持單元的保持內(nèi)容的 圖; 圖7A和7B是圖示通過根據(jù)本發(fā)明第一實施例的權(quán)重分布信息創(chuàng)建單元進行的權(quán) 重分布信息的創(chuàng)建方法的概述的圖; 圖8A和8B是圖示通過根據(jù)本發(fā)明第一實施例的權(quán)重分布信息創(chuàng)建單元創(chuàng)建的權(quán) 重分布信息和學習對象圖像之間的關(guān)系的概述的圖; 圖9A到9C是圖示通過根據(jù)本發(fā)明第一實施例的權(quán)重分布信息創(chuàng)建單元創(chuàng)建的權(quán)
重分布信息和通過最佳閾值確定單元確定的閾值之間的關(guān)系的概述的圖; 圖10A到10C是圖示根據(jù)本發(fā)明第一實施例的、將對應于通過弱假設(shè)確定單元確
定的弱假設(shè)的值記錄到面部檢測字典中的記錄方法的概述的圖; 圖IIA和IIB是圖示對學習對象圖像上的兩個點的組合創(chuàng)建的兩個權(quán)重分布曲線 的圖; 圖12A到12C是圖示用作根據(jù)本發(fā)明第一實施例的學習設(shè)備的學習對象的學習對 象圖像的示例的圖; 圖13A和13B是示意性圖示根據(jù)本發(fā)明第一實施例的權(quán)重保持單元的保持內(nèi)容的 圖; 圖14A到14C是圖示通過根據(jù)本發(fā)明第一實施例的權(quán)重分布信息創(chuàng)建單元進行的 權(quán)重分布信息的創(chuàng)建方法的概述的圖; 圖15A和15B圖示通過根據(jù)本發(fā)明第一實施例的權(quán)重分布信息創(chuàng)建單元創(chuàng)建的權(quán)重分布信息和學習對象圖像之間的關(guān)系的概述的圖; 圖WA和16B是圖示通過根據(jù)本發(fā)明第一實施例的權(quán)重分布信息創(chuàng)建單元創(chuàng)建的 權(quán)重分布信息和通過最佳閾值確定單元確定的閾值之間的關(guān)系的概述的圖;
圖17A到17C是圖示根據(jù)本發(fā)明第一實施例的、將對應于通過弱假設(shè)確定單元確 定的弱假設(shè)的值記錄到面部檢測字典中的記錄方法的概述的圖; 圖18是描述通過根據(jù)本發(fā)明第一實施例的學習設(shè)備進行的對象檢測字典創(chuàng)建處 理的處理過程的流程圖; 圖19是描述在通過根據(jù)本發(fā)明第一實施例的學習設(shè)備800進行的對象檢測字典 創(chuàng)建處理的處理過程中的弱假設(shè)確定處理過程的流程圖; 圖20A和20B是圖示根據(jù)本發(fā)明第一實施例的、用于計算確定對象圖像的多個評 估值的評估值計算字典的示例的圖; 圖21A和21B是圖示根據(jù)本發(fā)明第一實施例的、用于確定面部是否包括在確定對 象圖像中的面部確定字典的示例的圖; 圖22A到22D是圖示根據(jù)本發(fā)明第一實施例的、用于提取經(jīng)歷了面部檢測單元的 面部檢測處理的確定對象圖像的圖像提取方法的概述的圖; 圖23A和23B是圖示根據(jù)本發(fā)明第一實施例的、從圖像提取單元提取的確定對象
圖像和通過評估值計算單元對所述確定對象圖像計算的評估值的示例的圖; 圖24A到24D是圖示根據(jù)本發(fā)明第一實施例的、從圖像提取單元提取的確定對象
圖像和通過面部確定單元對所述確定對象圖像計算的評估值的示例的圖; 圖25A到25C是示意性圖示根據(jù)本發(fā)明第一實施例的、在用面部檢測單元執(zhí)行面
部檢測的情況下的流程的圖; 圖26是圖示根據(jù)本發(fā)明第一實施例的、經(jīng)歷通過面部檢測單元的面部檢測處理 的成像圖像、和通過面部檢測單元的面部檢測處理的檢測結(jié)果的圖; 圖27是描述根據(jù)本發(fā)明第一實施例的、通過成像設(shè)備進行的成像圖像記錄處理 的處理序列的流程圖; 圖28是描述根據(jù)本發(fā)明第一實施例的、通過成像設(shè)備進行的成像圖像記錄處理 的處理序列中的面部檢測處理序列的流程圖; 圖29是描述根據(jù)本發(fā)明第一實施例的、通過成像設(shè)備進行的面部檢測處理的處 理序列中的確定處理序列的流程圖; 圖30是描述根據(jù)本發(fā)明第一實施例的、通過成像設(shè)備進行的面部檢測處理的處 理序列中的第一評估值計算處理序列的流程圖; 圖31是描述根據(jù)本發(fā)明第一實施例的、通過成像設(shè)備進行的面部檢測處理的處 理序列中的第二評估值計算處理序列的流程圖; 圖32是圖示根據(jù)本發(fā)明第二實施例的面部檢測單元的功能配置示例的框圖;
圖33A到33D是圖示根據(jù)本發(fā)明第二實施例的、其中可通過位置計算單元對兩個 新的點的位置進行計算而計算評估值的對象的示例的圖; 圖34A到34D是圖示根據(jù)本發(fā)明第二實施例的、通過位置計算單元計算的兩個新 的位置和使用這兩個新的點的位置計算的評估值的關(guān)系示例的圖; 圖35A到35E是示意性圖示根據(jù)本發(fā)明第二實施例的、通過面部檢測單元執(zhí)行面部檢測的情況下的流程的圖; 圖36是圖示根據(jù)本發(fā)明第二實施例的、可通過面部檢測單元檢測的面部及其檢 測結(jié)果的示例的圖;以及 圖37是描述通過根據(jù)本發(fā)明第二實施例的成像設(shè)備進行的面部檢測處理的處理 過程的流程圖。
具體實施例方式
將在下面描述用于執(zhí)行本發(fā)明的優(yōu)選實施例(以下稱為實施例)。將按以下順序 進行描述。 1.第一實施例(面部檢測控制用于從圖像檢測面部的示例和用于面部檢測的字 典信息的創(chuàng)建示例) 2.第二實施例(面部檢測控制用于從圖像檢測面部的修改示例) 第一實施例 成像設(shè)備的配置示例 圖1是圖示根據(jù)本發(fā)明第一實施例的成像設(shè)備100的功能配置示例的框圖。成像 設(shè)備100具有透鏡111、成像單元112、系統(tǒng)控制單元120、存儲設(shè)備單元130、外部接口單 元140、記錄單元150、操作輸入單元160、顯示單元170、音頻輸出單元180和相機控制單元 200。成像設(shè)備IOO例如可通過數(shù)字照相機實現(xiàn),該數(shù)字照相機對被攝體成像,并生成圖像 數(shù)據(jù),對圖像數(shù)據(jù)通過圖像分析提取每個特征量,并使用提取的特征量執(zhí)行各種類型的圖 像處理。 透鏡111由會聚來自被攝體的光的多個透鏡(變焦透鏡、聚焦透鏡等)組成,并且 來自被攝體的輸入光經(jīng)由這些透鏡提供到成像單元112。 成像單元112具有成像設(shè)備(未示出)和信號處理單元(未示出),該成像設(shè)備具 有電子快門功能,該信號處理單元處理成像設(shè)備的輸出信號并生成成像圖像(圖像數(shù)據(jù))。 也就是說,利用成像單元112,被攝體的輸入光學圖像經(jīng)由透鏡111在成像設(shè)備的成像面上 成像,該成像設(shè)備在該狀態(tài)下執(zhí)行成像操作,并且信號處理單元執(zhí)行關(guān)于成像信號的信號 處理,從而生成成像圖像。生成的成像圖像然后提供到存儲設(shè)備單元130并存儲其中。注 意,通過相機控制單元200順序確定用于生成成像圖像的相機參數(shù)(成像參數(shù))。
相機控制單元200基于經(jīng)由存儲設(shè)備單元130從成像單元112提供的成像圖像和 來自系統(tǒng)控制單元120的控制,控制成像單元112。注意,將參照圖2詳細描述相機控制單 元200。 系統(tǒng)控制單元120執(zhí)行成像設(shè)備100的整體控制。例如,系統(tǒng)控制單元120根據(jù) 通過操作輸入單元160接受的、來自用戶的操作輸入,執(zhí)行控制。此外,系統(tǒng)控制單元120 控制在顯示單元170上顯示的菜單圖像等的顯示、關(guān)于記錄單元150的成像圖像的記錄和 讀取、經(jīng)由外部接口單元140執(zhí)行的與外部計算機和網(wǎng)絡(luò)的通信等。此外,在圖像操作期間 進行監(jiān)視時,系統(tǒng)控制單元120執(zhí)行控制,以便在顯示單元170上顯示通過成像單元112生 成的成像圖像。 存儲設(shè)備單元130是為了暫時保存成像設(shè)備100系統(tǒng)上的成像圖像等的主存儲設(shè) 備,并且例如由DRAM(動態(tài)隨機存取存儲器)組成。也就是說,主要經(jīng)由存儲設(shè)備單元130執(zhí)行成像設(shè)備100內(nèi)的各個單元之間的成像圖像的交換。 外部接口單元140是具有如USB(通用串行總線)等的輸入/輸出端子的外部接 口 ,并且提供用于與外部計算機的連接和網(wǎng)絡(luò)連接的接口。 記錄單元150基于系統(tǒng)控制單元120的控制,記錄通過成像單元112生成的成像
圖像。此外,記錄單元150基于系統(tǒng)控制單元120的控制,讀取記錄的成像圖像,并將其提
供到系統(tǒng)控制單元120。例如,如閃存等的記錄介質(zhì)可用作記錄單元150。此外,記錄單元
150可內(nèi)置到成像設(shè)備100中,或可安裝在成像設(shè)備100上以便可拆卸。 操作輸入單元160是從用戶接收操作輸入的操作輸入單元,并且將根據(jù)接受的操
作輸入的信號輸出到系統(tǒng)控制單元120。例如,在按下用于指令成像圖像的記錄的快門按鈕
時,將根據(jù)按下快門按鈕的信號輸出到系統(tǒng)控制單元120。 顯示單元170是用于基于系統(tǒng)控制單元120的控制顯示各種類型的圖像的顯示單 元。例如,顯示單元170顯示通過成像單元112生成的成像圖像、從記錄單元150讀取的成 像圖像以及提供給用戶的菜單屏幕等。 音頻輸出單元180基于系統(tǒng)控制單元120的控制,輸出各種類型的音頻信息。音 頻輸出單元180可用例如揚聲器實現(xiàn)。 圖2是圖示根據(jù)本發(fā)明第一實施例的相機控制單元200的功能配置示例的框圖。 在圖2中,與相機控制單元200的功能配置示例一起,還示出了圖1中示出的成像單元112、 系統(tǒng)控制單元120和存儲設(shè)備單元130的配置。相機控制單元200具有順序控制單元210、 相機參數(shù)控制單元220、面部檢測單元230、以及存儲設(shè)備接口 240。經(jīng)由存儲設(shè)備接口 240 執(zhí)行存儲設(shè)備單元130和相機參數(shù)控制單元220之間、以及存儲設(shè)備單元130和面部檢測 單元230之間執(zhí)行的成像圖像的交換。 順序控制單元210用來自系統(tǒng)控制單元120的成像圖像記錄等待命令啟動,并且 維持可記錄通過成像單元112生成的成像圖像的狀態(tài)。在該成像圖像記錄等待狀態(tài)下,通 過成像單元112生成的成像圖像順序記錄到記錄設(shè)備單元130中。例如,存儲設(shè)備單元130 中記錄的成像圖像以1/60秒增量順序更新。此外,順序控制單元210執(zhí)行控制,使得相機 參數(shù)控制單元220基于存儲設(shè)備單元130中存儲的當前成像圖像(通過成像單元112生成 的最新成像圖像),確定相機參數(shù)。此外,順序控制單元210執(zhí)行對于面部檢測單元230的 控制,以便對于存儲設(shè)備單元130中存儲的當前成像圖像執(zhí)行面部檢測處理。在從面部檢 測單元230輸出顯示已經(jīng)檢測到面部的面部檢測信息的情況下,順序控制單元210將意思 是(to the effect that)已經(jīng)檢測到面部的信息輸出到系統(tǒng)控制單元120和相機參數(shù)控 制單元220。 相機參數(shù)控制單元220確定關(guān)于成像圖像的相機參數(shù),并且使用所確定的相機參
數(shù)執(zhí)行關(guān)于成像單元112的成像控制。具體地,相機參數(shù)控制單元220基于來自順序控制單
元210的觸發(fā),經(jīng)由存儲設(shè)備接口 240獲得存儲設(shè)備單元130中存儲的當前成像圖像。評
估當前成像圖像,并且確定如快門速度、曝光、白平衡等的相機參數(shù)。此外,在當前成像圖像
中檢測到面部的情況下,相機參數(shù)控制單元220基于檢測到的面部和當前成像圖像評估,
確定如快門速度、曝光、白平衡等的相機參數(shù)。例如,在檢測到面部的情況下,基于成像圖像
中檢測到的面部的位置和大小,確定對于檢測到的面部最佳的相機參數(shù)。 面部檢測單元230使存儲設(shè)備單元130中存儲的當前成像圖像經(jīng)歷面部檢測處理,并且在檢測到面部的情況下,將面部檢測信息輸出到順序控制單元210。具體地,基于來 自順序控制單元210的觸發(fā),面部檢測單元230經(jīng)由存儲設(shè)備接口 240獲得存儲設(shè)備單元 130中存儲的當前成像圖像,并且使當前成像圖像經(jīng)歷面部檢測處理。面部檢測信息是關(guān)于 檢測到的面部的信息,并且例如是包括表示成像圖像中的檢測到的面部的位置的分數(shù)、面 部的大小、類型(面部的朝向等)、以及程度的信息。注意,將參照圖3詳細描述面部檢測單 元230。 圖3是圖示根據(jù)本發(fā)明第一實施例的面部檢測單元230的功能配置示例的框圖。 面部檢測單元230具有圖像獲得單元231、圖像縮小(reduction)單元232、圖像提取單元 233、評估值計算單元235、選擇單元236、面部確定單元237、確定結(jié)果輸出單元238、評估值 計算字典存儲單元300、以及面部確定字典存儲單元310。 圖像獲得單元231經(jīng)由存儲設(shè)備接口 240獲得存儲設(shè)備單元130中存儲的成像圖 像,并將獲得的成像圖像輸出到圖像縮小單元232。 圖像縮小單元232通過以預定比率順序縮小從圖像獲得單元231輸出的成像圖 像,生成不同大小的多個圖像,并且將生成的圖像順序輸出到圖像提取單元233。注意,將參 照圖22A到22D詳細描述成像圖像的縮小。 圖像提取單元233對于從圖像縮小單元232輸出的每個圖像,順序提取每個圖像 的預定區(qū)域中包括的圖像,并且將提取的圖像(確定的對象圖像)輸出到評估值計算單元 235和面部確定單元237。將參照圖22A到22D詳細描述該圖像的提取。
評估值計算字典存儲單元300對每個對象存儲用于計算評估值的評估值計算字 典,以評估多個對象中的哪個包括在從圖像提取單元233輸出的圖像中。將所存儲的評估 值計算字典提供給評估值計算單元235。描述本發(fā)明的第一實施例以將多個對象例示為面 向不同方向的多個面部。注意,將參照圖5A到17C等詳細描述評估值計算字典的創(chuàng)建方法。 此外,將參照圖20A和20B詳細描述評估值計算字典的存儲內(nèi)容。注意,評估值計算字典存 儲單元300是發(fā)明內(nèi)容中所指的確定信息存儲單元的示例。 面部確定字典存儲單元310對于每個對象,將用于確定所標識的對象是否包括在 從圖像提取單元233輸出的圖像中的面部確定字典相關(guān)。將所存儲的面部確定字典提供到 面部確定字典存儲器239。對于與使用評估值計算字典存儲單元300中存儲的評估值計算 字典計算的評估值相對應的多個對象的每個,將面部確定字典存儲在面部確定字典存儲單 元310中。注意,將參照圖5A到17C等詳細描述面部確定字典的創(chuàng)建方法。此外,將參照 圖21A和21B詳細描述面部確定字典的存儲內(nèi)容。注意,面部確定字典存儲單元310是發(fā) 明內(nèi)容中所指的確定信息存儲單元的示例。 面部確定字典存儲器239是用于存儲面部確定字典存儲單元310中存儲的多個面 部確定字典當中的一個或多個面部確定字典的工作存儲器,并且將存儲的面部確定字典中 的內(nèi)容提供到面部確定單元237。 評估值計算單元235從自圖像提取單元233輸出的確定對象圖像中的多個區(qū)域提 取特征量,并且比較提取的各個特征量中的兩個特征量,從而同時計算多個對象的評估值。 將每個計算的對象的評估值輸出到選擇單元236。評估值計算字典存儲單元300中存儲的 評估值計算字典用于評估值的計算。注意,將參照圖23A到25C詳細描述通過評估值計算 單元235進行的評估值的計算。此外,評估值計算單元235是發(fā)明內(nèi)容中所指的比較單元
11和計算單元的示例。 選擇單元236從自評估值計算單元235輸出的每個對象的評估值中選擇滿足一定 條件的評估值,并將關(guān)于涉及所選擇的評估值的對象的信息(選擇對象信息)輸出到面部 確定單元237。 一定條件例如可以是每個對象的評估當中的預定數(shù)量的具有高的值的評估 值。此外,一定條件例如可以是預定數(shù)量的評估值當中的超過定義值的評估值。注意,將參 照圖23A到25C詳細描述通過選擇單元236進行的評估值的選擇方法。
面部確定單元237執(zhí)行面部確定處理,以便確定面部是否包括在從圖像提取單元 233輸出的確定對象圖像中。確定結(jié)果輸出到確定結(jié)果輸出單元238。例如,輸出成像圖 像中的檢測到的面部的位置和大小、類型(面部的朝向等)、以及表示面部的程度的分數(shù), 作為確定結(jié)果。具體地,面部確定單元237使關(guān)于通過選擇單元236選擇的評估值的對象 相關(guān),并將面部確定字典存儲單元310中存儲的面部確定字典保持在面部確定字典存儲器 239中。使用面部確定字典存儲器239中保持的面部確定字典,從自圖像提取單元233輸出 的確定對象圖像中的多個區(qū)域提取特征量,并且比較提取的各個特征量中的兩個特征量, 從而對每個面部確定字典計算評估值。基于這里的評估值,進行關(guān)于面部是否包括在從圖 像提取單元233輸出的確定對象圖像中的確定。注意,將參照圖23A到25C詳細描述通過 面部確定單元237進行的面部確定處理。此外,面部確定單元237是發(fā)明內(nèi)容中所指的計 算單元和比較單元的示例。 在從面部確定單元237輸出面部包括在從圖像提取單元233輸出的確定對象圖像 中的確定的確定結(jié)果的情況下,確定結(jié)果輸出單元238將指示意思是已經(jīng)從成像圖像檢測 到面部的信息的面部檢測信息輸出到順序控制單元210。面部檢測信息例如包括成像圖像 中檢測到的面部的位置和大小、類型(面部的朝向等)、以及表示面部的程度的分數(shù)。
學習設(shè)備的配置示例 接下來,將參照附圖詳細描述用于創(chuàng)建根據(jù)本發(fā)明第一實施例的面部檢測處理中 使用的評估值計算字典和面部確定字典的學習設(shè)備。注意,本發(fā)明實施例中示出的學習意 味著基于大量數(shù)據(jù)發(fā)現(xiàn)數(shù)據(jù)背后的規(guī)律性。 圖4是示出根據(jù)本發(fā)明第一實施例的學習設(shè)備800的功能配置示例的框圖。學 習設(shè)備800具有學習對象圖像輸入單元801、亮度差值計算單元802、權(quán)重分布信息創(chuàng)建單 元803、最佳閾值確定單元804、弱假設(shè)(弱學習器)確定單元805、以及權(quán)重計算單元806。 此外,學習設(shè)備800具有權(quán)重更新單元807、記錄控制單元808、權(quán)重保持單元810以及面部 檢測字典存儲單元820。在該示例中,將描述創(chuàng)建用于檢測人的面部的面部檢測字典的示 例。面部檢測字典對應于圖3中示出的評估值計算字典存儲單元300中存儲的評估值計算 字典和面部確定字典存儲單元310中存儲的面部確定字典。注意,學習設(shè)備800用如Real AdaBoost等的學習算法實現(xiàn)。 學習對象圖像輸入單元801對于學習對象圖像的每種類型,輸入用作學習樣本的 學習對象圖像,并將輸入的學習對象圖像輸出到亮度差值計算單元802和權(quán)重更新單元 807。根據(jù)本發(fā)明第一實施例,示出了使用已經(jīng)被規(guī)范化為24像素X24像素的圖像作為輸 入到學習對象圖像輸入單元801的學習對象圖像的示例。此外,在創(chuàng)建用于檢測人的面部 的面部檢測字典的情況下,包括人的面部的樣本圖像(學習對象正面面部圖像)和不包括 人的面部的樣本圖像(學習對象非面部圖像)作為學習對象圖像輸入到學習對象圖像輸入
12單元801中。在此情況下,作為學習對象正面面部圖像,例如,可使用已經(jīng)被規(guī)范化使得面 部的雙眼的位置在每個學習對象圖像中的相同位置處的圖像。此外,例如,將大約10, 000 個圖像輸入為學習對象正面面部圖像,并且將大約100, 000個圖像輸入為學習對象非面部 圖像。將參照圖5A和5B以及12A到12C詳細描述這些圖像示例。 亮度差值計算單元802對每個學習對象圖像,計算從學習對象圖像輸入單元801 輸出的學習對象圖像上的兩點之間的亮度的差值。使所計算的差值與經(jīng)歷計算的學習對象 圖像和兩點之間的位置相關(guān),并輸出到權(quán)重分布信息創(chuàng)建單元803。在學習對象圖像上的相 同兩點處的兩種計算方式中(例如,在兩點的亮度值是A和B的情況下的"A-B"、"B-A"), 僅正/負符號不同,并且絕對值是相同值。因此,在兩種計算方式中,執(zhí)行一種計算,而可以 忽略另一種計算。也就是說,亮度差值計算單元802對于組成從學習對象圖像輸入單元801 輸出的學習對象圖像的像素的兩點之間的每個組合(576C2 = 165,600種方式)計算亮度的 差值。注意,亮度差值計算單元802是發(fā)明內(nèi)容中所指的差值計算單元的示例。
權(quán)重分布信息創(chuàng)建單元803對兩點的每個組合創(chuàng)建權(quán)重分布信息,所述權(quán)重分布 信息指示為經(jīng)歷計算的學習對象圖像給出的權(quán)重關(guān)于從亮度差值計算單元802輸出的兩 點之間的亮度的差值的分布狀態(tài)。注意,權(quán)重分布信息分類為學習對象正面面部圖像和學 習對象非面部圖像,并被創(chuàng)建。計算的權(quán)重分布信息與經(jīng)歷創(chuàng)建的兩點的組合相關(guān),并輸出 到最佳閾值確定單元804和權(quán)重更新單元807。注意,為學習成像圖像給出的權(quán)重保持在權(quán) 重保持單元810中。此外,將參照圖7A到8B以及14A到15B詳細描述權(quán)重分布信息的創(chuàng) 建。注意,權(quán)重分布信息創(chuàng)建單元803是發(fā)明內(nèi)容中所指的分布信息創(chuàng)建單元的示例。
最佳閾值確定單元804基于從權(quán)重分布信息創(chuàng)建單元803輸出的權(quán)重分布信息, 確定對于兩點的每個組合的最佳閾值。所確定的最佳閾值和經(jīng)歷確定的權(quán)重分布信息與兩 點的組合相關(guān)并輸出到弱假設(shè)確定單元805。將參照圖8A和8B以及15A到15C詳細描述 最佳閾值的確定。 弱假設(shè)確定單元805基于通過權(quán)重分布信息創(chuàng)建單元803創(chuàng)建的權(quán)重分布信息, 確定最佳弱假設(shè)。具體地,弱假設(shè)確定單元805從自最佳閾值確定單元804輸出的每個最 佳閾值確定一個閾值,并將對應于該閾值的權(quán)重分布信息的弱假設(shè)確定為最佳弱假設(shè)。將 確定的閾值、以及最佳弱假設(shè)和對應于該弱假設(shè)的權(quán)重分布信息相關(guān)并輸出到權(quán)重計算單 元806、權(quán)重更新單元807和記錄控制單元808。將參照圖9A到9C和16A和16B詳細描述 弱假設(shè)的確定。注意,弱假設(shè)確定單元805是發(fā)明內(nèi)容中所指的確定單元的示例。
權(quán)重計算單元806使用對應于從弱假設(shè)確定單元805輸出的最佳弱假設(shè)的權(quán)重分 布信息計算權(quán)重(加權(quán)多數(shù)值),并將計算的權(quán)重值輸出到記錄控制單元808。將參照圖 10A到10C和17A到17C詳細描述該權(quán)重的計算。 權(quán)重更新單元807更新對應于權(quán)重保持單元810中保持的每個學習對象圖像的權(quán) 重。具體地,權(quán)重更新單元807基于來自權(quán)重分布信息創(chuàng)建單元803的權(quán)重分布信息、對應 于來自弱假設(shè)確定單元805的最佳弱假設(shè)的最佳閾值、以及來自權(quán)重計算單元806的權(quán)重 值,更新每個權(quán)重。將參照圖10A到10C和17A到17C詳細描述權(quán)重的更新。
記錄控制單元808將從權(quán)重計算單元806輸出的權(quán)重值以及閾值和從弱假設(shè)確定 單元805輸出的最佳弱假設(shè)相關(guān),并將其記錄在面部檢測字典存儲單元820中。將參照圖 10A到10C和17A到17C詳細描述該面部檢測字典。
權(quán)重保持單元810保持為從學習對象圖像輸入單元801輸出的每個學習對象圖 像給出的權(quán)重,并將保持的權(quán)重提供到權(quán)重分布信息創(chuàng)建單元803。此外,用權(quán)重更新單元 807更新權(quán)重保持單元810中保持的權(quán)重。注意,將參照圖6A和6B以及13A和13B詳細描 述權(quán)重保持單元810的保持內(nèi)容。 圖5A和5B是圖示根據(jù)本發(fā)明第一實施例、用作學習設(shè)備800的學習對象的學習 對象圖像的示例的圖。圖5A示出由多個學習對象正面面部圖像組成的學習對象正面面部 圖像組830,并且圖5B示出由多個學習對象非面部圖像組成的學習對象非面部圖像組840。 注意,在圖5A和5B中示出的示例中,為描述方便,將簡化的圖像示出為學習對象圖像。
例如,將包括人的面部(正面面部)的大量樣本圖像用作學習對象正面面部圖像, 如圖5A中示出的學習對象正面面部圖像831到834。此外,將不包括人的面部的大量樣本 圖像用作學習對象非面部圖像,如圖5B中示出的學習對象非面部圖像841到844。注意,在 該示例的情況下,將描述在使用大約10, OOO個學習對象正面面部圖像和大約100, 000個學 習對象非面部圖像創(chuàng)建面部檢測字典的情況下的示例。每個學習對象圖像按類型順序輸入 到學習對象圖像輸入單元801中。 圖6A和6B是示意性示出根據(jù)本發(fā)明第一實施例的權(quán)重保持單元810的保持內(nèi)容 的圖。圖6A示出其中在權(quán)重保持單元810保持權(quán)重的學習對象圖像,并且圖6B示出對應 于學習對象圖像的權(quán)重保持單元810的保持內(nèi)容。此外,圖6A和6B的相關(guān)性示出為通過 箭頭連結(jié)在一起。注意,圖5A和5B中示出的學習對象圖像的一部分示出為圖6A中示出的 學習對象正面面部圖像組830和學習對象非面部圖像組840中包括的學習對象圖像,并且 在學習對象圖像相同處附上相同的參考標號。 學習對象圖像區(qū)分信息(Xi)811、權(quán)重(Wit)812、以及面部圖像/非面部圖像標識 信息(yi)813保持在權(quán)重保持單元810中。對于從學習對象圖像輸入單元801輸出的每個 學習對象圖像,這里的各種信息通過權(quán)重更新單元807存儲,并被更新。
學習對象圖像區(qū)分信息(Xi)811是用于區(qū)分學習對象圖像輸入單元801中輸入的 學習對象圖像的區(qū)分信息,并且例如將Xi(i是滿足1《i《k的整數(shù))與學習對象圖像相
關(guān)并保持。在圖6B示出的示例中,示出了其中K個學習對象圖像輸入到學習對象圖像輸入 單元801中的情況。例如,可以設(shè)K二 110, 000。權(quán)重(Wit)812是對學習對象圖像輸入單元801中輸入的每個學習對象圖像給出的
權(quán)重,并且通過權(quán)重更新單元807順序更新。權(quán)重(Wit)812是被規(guī)范化以便滿足下面的表
達式1的值。此外,對于緊接在后輸入到學習對象圖像輸入單元801中的每個學習對象圖
像給出相同值(1/K)作為權(quán)重(W/)?,F(xiàn)在,i對應于學習對象圖像區(qū)分信息(Xi)811的i,
并且t是提升(boosting)的情況下的循環(huán)計數(shù)器,例如,可以設(shè)t = 2, 000到3, 000。 K =1...表達式1
i =1 面部圖像/非面部圖像標識信息(yi)813是標識輸入到學習對象圖像輸入單元 801的學習對象圖像的類型的信息,并且例如,"l"保持在學習對象正面面部圖像中,而 "-l"保持在學習對象非面部圖像中。根據(jù)從學習對象圖像輸入單元801輸出的學習對象圖 像的類型,用權(quán)重更新單元807存儲該面部圖像/非面部圖像標識信息。
面部檢測字典的創(chuàng)建示例 圖7A和7B是示出根據(jù)本發(fā)明第一實施例、通過權(quán)重分布信息創(chuàng)建單元803進行 的權(quán)重分布信息的創(chuàng)建方法的概述的圖。圖7A示出用于計算每個學習對象圖像上的兩點 之間的亮度的差值的計算方法的概述。在圖7A中,在學習對象正面面部圖像組830和學習 對象非面部圖像組840中包括的各學習對象圖像中,示出學習對象正面面部圖像831和832 以及學習對象非面部圖像842和844,并示出用于計算亮度的差值的示例。此外,對于其他 學習對象圖像可執(zhí)行相同處理。此外,對于每個學習對象圖像加權(quán)的權(quán)重(W"在每個學習 對象圖像的下面部分的虛線矩形中示出。權(quán)重(W"與每個學習對象圖像相關(guān)并保持在權(quán) 重保持單元810中。 首先,亮度差值計算單元802提取每個學習對象圖像上的相同兩點的亮度,并對 每個學習對象圖像計算提取的兩點的亮度的差值。例如,如圖7A所示,提取學習對象正面 面部圖像831和832以及學習對象非面部圖像842和844中的兩點(像素位置Pll和P12) 的亮度,并計算提取的兩點的亮度的差值。 圖7B示出用于基于每個學習對象圖像上的兩點之間的亮度的差值創(chuàng)建權(quán)重分布 信息的創(chuàng)建方法的概述。在圖7B中,權(quán)重分布曲線圖示出為權(quán)重分布信息,其中水平軸是 示出亮度的差值的軸(-255到255),并且垂直軸是示出權(quán)重的乘積值的軸。
權(quán)重分布信息創(chuàng)建單元803將與從其計算差值的學習對象圖像相關(guān)并保持在權(quán) 重保持單元810中的權(quán)重(Wit)、與通過亮度差值計算單元802計算的差值的級別相加。例 如,如圖7B所示,對應于每個學習對象圖像的權(quán)重(W/,W二Wit,W/)與對學習對象正面面部 圖像831和832和學習對象非面部圖像842和844計算的差值的級別相加。此外,對于其 他學習對象圖像,以相同方式將對應于每個學習對象圖像的權(quán)重(W"順序相加,并且創(chuàng)建 權(quán)重分布信息。注意,對緊接在后面輸入到學習對象圖像輸入單元801中的每個學習對象 圖像給出相同值(1/K)作為權(quán)重(W/),從而,在t = 1的情況下,將相同權(quán)重(W"順序相 加。此外,對于學習對象圖像上的其他兩點的組合(對),類似地,將與每個學習對象圖像相 關(guān)的權(quán)重(W"順序相加,并且創(chuàng)建權(quán)重分布信息。因此,圖8A和8B中示出對每個學習對 象圖像中的兩點(像素位置P11和P12)的組合創(chuàng)建的權(quán)重分布信息的示例。
圖8A和8B是示出根據(jù)本發(fā)明第一實施例、通過權(quán)重分布信息創(chuàng)建單元803創(chuàng)建 的權(quán)重分布信息與學習對象圖像之間的關(guān)系的概述的圖。圖8A示出學習對象正面面部圖 像組830和學習對象非面部圖像組840中包括的各種學習對象圖像。這些學習對象圖像與 圖5A和5B中的學習對象圖像相同。 圖8B示出對兩點(像素位置Pll和P12)的組合創(chuàng)建的權(quán)重分布曲線(權(quán)重分布 信息)850。權(quán)重分布曲線850是對每種學習對象圖像、用圖7A和7B所示的權(quán)重分布信息 的創(chuàng)建方法、通過將對每個順序相加的級別的權(quán)重(W"的乘積值連結(jié)在一起而創(chuàng)建的曲 線。利用權(quán)重分布曲線,可以看到根據(jù)每種學習對象圖像的特征權(quán)重分布狀態(tài)。此外,利用 權(quán)重分布曲線,可以對面部圖像和非面部圖像的每個獲得獨立的權(quán)重分布。例如,利用圖8B 所示的權(quán)重分布曲線850,設(shè)在右側(cè)的以鐘形生成的曲線是對應于面部圖像的曲線,并且在 左側(cè)的以鐘形生成的曲線是對應于非面部圖像的曲線。權(quán)重分布的特征經(jīng)常根據(jù)作為亮度 差值的計算對象的兩點的組合而不同。 將描述用于執(zhí)行面部和非面部之間的區(qū)分的閾值的確定方法。例如,設(shè)圖8B所示的權(quán)重分布曲線850上的垂直軸的值是d(d是滿足-255《d《255的整數(shù)),并且水平軸 上的常數(shù)是thl (thl是滿足-255《thl《255的整數(shù))。在此情況下,設(shè)小于常數(shù)thl的 學習對象正面面部圖像的權(quán)重分布曲線上的值是P^(d),并且等于或大于常數(shù)thl的學習 對象正面面部圖像的權(quán)重分布曲線上的值是P/(d)。此外,設(shè)小于常數(shù)thl的學習對象非面 部圖像的權(quán)重分布曲線上的值是Pf(d),并且等于或大于常數(shù)thl的學習對象非面部圖像 的權(quán)重分布曲線上的值是Pf(d)。注意,在圖8B中,小于常數(shù)thl的面部圖像的權(quán)重分布曲 線(Pj(d))用細的虛線示出,而等于或大于常數(shù)thl的面部圖像的權(quán)重分布曲線(PH+(d)) 用粗的虛線示出。此外,小于常數(shù)thl的非面部圖像的權(quán)重分布曲線(Pf(d))用粗線示出, 而等于或大于常數(shù)thl的非面部圖像的權(quán)重分布曲線(PH—(d))用細線示出。
在此情況下,最佳閾值確定單元804比較常數(shù)thl的兩側(cè)上的權(quán)重分布的總和。例 如,使用下面的表達式2到5,計算常數(shù)thl的兩側(cè)上的權(quán)重分布總和PH+、 P二 PH—和P^一。
<formula>formula see original document page 16</formula> 接下來,最佳閾值確定單元804使用下面的表達式6,計算對于計算的權(quán)重分布總 和PH+、PL+、PH—和PL—的值T1。 T1 =/"(Pl_+XPL—)+V"(PH+XPH-)...表達式6 接下來,最佳閾值確定單元804確定常數(shù)thl,其中計算的值Tl是最小的,作為關(guān) 于與圖8B所示的權(quán)重分布曲線850對應的兩點(像素位置P11和P12)的組合的閾值thl。 此外,對于學習對象圖像上的其他兩點的組合(對),類似地,權(quán)重分布信息用于確定閾值。 因此,對于每個學習對象圖像上的兩點的組合,在圖9A到9C中示出創(chuàng)建的權(quán)重分布信息和 基于權(quán)重分布信息確定的閾值的示例。 圖9A到9C是示意性示出通過權(quán)重分布信息創(chuàng)建單元803創(chuàng)建的權(quán)重分布信息和 通過最佳閾值確定單元804確定的閾值之間的關(guān)系的圖。此外,圖9A到9C示出權(quán)重分布 信息和閾值、以及與此對應的學習對象圖像上的兩點的組合。注意,在圖9A到9C中,在學 習對象正面面部圖像組830和學習對象非面部圖像組840中包括的學習對象圖像中,僅示 出學習對象正面面部圖像832和學習對象非面部圖像842。此外,如圖9A中所示的學習對 象圖像上的兩點的組合以及權(quán)重分布信息和閾值之間的關(guān)系類似于圖8A和8B中所示的關(guān) 系。注意,圖9A中示出的權(quán)重分布曲線850用曲線851示出對應于學習對象非面部圖像的權(quán)重分布曲線,并且用曲線852示出對應于學習對象正面面部圖像的權(quán)重分布曲線。
圖9B示出對學習對象圖像上的兩點(像素位置P21和P22)的組合創(chuàng)建的權(quán)重分 布曲線853和基于權(quán)重分布曲線853確定的閾值th2之間的關(guān)系。此外,對于權(quán)重分布曲 線853,在曲線854中示出對應于學習對象非面部圖像的權(quán)重分布曲線,并且在曲線855中 示出對應于學習對象正面面部圖像的權(quán)重分布曲線。 圖9C示出對學習對象圖像上的兩點(像素位置Pjl和Pj2)的組合創(chuàng)建的權(quán)重分 布曲線856和基于權(quán)重分布曲線856確定的閾值thj之間的關(guān)系。此外,對于權(quán)重分布曲 線856,在曲線857中示出對應于學習對象非面部圖像的權(quán)重分布曲線,并且在曲線858中 示出對應于學習對象正面面部圖像的權(quán)重分布曲線。 因此,最佳閾值確定單元804使用對學習對象圖像上的兩點的每個組合(對)的 權(quán)重分布曲線(權(quán)重分布信息)來確定閾值thl到thj。接下來,弱假設(shè)確定單元805確定 所確定的閾值thl到thj當中使用上述表達式6計算的值Tl變?yōu)樽钚〉拈撝怠?所確定的閾值的權(quán)重分布信息的弱假設(shè)確定為最佳弱假設(shè)。 圖10A到圖10C是示意性示出根據(jù)本發(fā)明第一實施例、用于將對應于通過弱假設(shè) 確定單元805確定的弱假設(shè)的值記錄在面部檢測字典中的記錄方法的圖。圖IOA示出對應 于通過弱假設(shè)確定單元805確定的閾值thr和學習對象圖像上的兩點(像素位置Prl和 Pr2)的組合的權(quán)重分布曲線860。注意,在圖10A中,示出閾值thr的位置的線示出為粗線。 此外,對于權(quán)重分布曲線860,對應于學習對象非面部圖像的曲線用曲線861示出,并且對 應于學習對象正面面部圖像的曲線用曲線862示出。 圖10B示出計算通過弱假設(shè)確定單元805確定的閾值thr的兩個權(quán)重的權(quán)重計 算單元806。權(quán)重計算單元806使用下面的表達式7和8,基于權(quán)重分布總和PH+、P:PH—和 Pp對權(quán)重分布曲線860的閾值thr的兩側(cè)計算權(quán)重h(x)(兩個權(quán)重hH(x)和hjx))。注 意,如表達式7和8中示出的x區(qū)分要檢測的圖像。
Z PH+ …表達式7 <formula>formula see original document page 17</formula>
Z PL+ ...表達式8
<formula>formula see original document page 17</formula> 圖IOC示出其中將對應于通過弱假設(shè)確定單元805確定的弱假設(shè)的值記錄在面 部檢測字典821中的示例的模型。將面部檢測字典821存儲在面部檢測字典存儲單元820 中。具體地,將通過弱假設(shè)確定單元805確定的閾值thr的值記錄在面部檢測字典821的 閾值(9 )824中。此外,在對應于閾值thr的兩點(像素位置Prl和Pr2)的組合中,將其 中一點(像素位置Prl)記錄在面部檢測字典821的位置1(ul,vl)822處。此外,在對應于 閾值thr的兩點(像素位置Prl和Pr2)的組合中,將另一點(像素位置Pr2)記錄在面部 檢測字典821的位置2(u2,v2)823處?,F(xiàn)在,例如,在學習對象圖像的左上角是原點的情況下,設(shè)學習對象圖像的水平方向上的位置是ul和u2,并且學習對象圖像的垂直方向上的位 置是vl和v2。此外,對閾值thr計算的權(quán)重h(x)(兩個權(quán)重K(x)和hjx))記錄在面部 檢測字典821的權(quán)重(a)825中。例如,權(quán)重hjx)記錄在權(quán)重(a)825的(H)中,并且權(quán) 重K(x)記錄在權(quán)重(a)825的(L)中。這里的各種值通過記錄控制單元808記錄在面部 檢測字典821中。 接下來,權(quán)重更新單元807使用下面的表達式9來計算對每個學習對象圖像給出 的權(quán)重Wit+、并且更新權(quán)重保持單元810中保持的權(quán)重。該更新稱為提升操作。 <formula>formula see original document page 18</formula>
1 K ...表達式9
exp(-yiht(Xi)) 現(xiàn)在,Wj和yi是與用作對象的學習對象圖像Xi相關(guān)并保持在權(quán)重保持單元810 中的值(圖6A和6B所示)。此外,Ht(Xi)是根據(jù)對兩點(圖像位置Prl和Pr2)的組合計 算的每個學習對象圖像的亮度的差值而確定的值,該兩點的組合對應于通過弱假設(shè)確定單 元805確定的閾值thr。具體地,在對用作對象的學習對象圖像Xi計算的亮度的差值Pd為 PD^thr的情況下,使用表達式7計算的權(quán)重K(Xi)用作、00。另一方面,在對用作對象 的學習對象圖像Xi計算的亮度的差值Pd為PD < thr的情況下,使用利用表達式8計算的 權(quán)重K(Xi)。因此,例如,使用通過弱假設(shè)確定單元805確定的閾值作為標準,對于不同地 區(qū)分的學習對象圖像,使得權(quán)重更重,并且可以更容易地用下面的循環(huán)來反映。因此,對緊 接在后面輸入到學習對象圖像輸入單元801的每個學習對象圖像給出相同的值(1/K)作為 權(quán)重(W/),但是根據(jù)每個學習對象圖像修改對于t = 2及此后的權(quán)重(W"。
接下來,重復上述處理,直到實現(xiàn)期望的循環(huán)數(shù),或直到實現(xiàn)期望的精度。因此,根 據(jù)本發(fā)明第一實施例,根據(jù)在通過弱假設(shè)確定單元805確定的閾值以上/以下計算不同的 權(quán)重。因此,即使對用現(xiàn)有技術(shù)難以區(qū)分的圖像也可以容易地在面部檢測處理中進行檢測, 并且可以改進面部檢測精度。 圖IIA和IIB是示出關(guān)于在學習對象圖像上的兩點的組合創(chuàng)建的兩個權(quán)重分布曲 線的圖。圖11A所示的權(quán)重分布曲線850類似于圖9A所示的權(quán)重分布曲線850。在該情況 下,對應于學習對象非面部圖像的曲線和對應于學習對象正面面部圖像的曲線的特征示出 在閾值以上/以下,從而認為這兩者之間的區(qū)分相對清楚。 圖11B所示的權(quán)重分布曲線865是在閾值thl0或更小處區(qū)分非面部或面部困難、 但在閾值th10或更大處可以使得區(qū)分相對清楚的情況下的權(quán)重分布曲線的示例。對于權(quán) 重分布曲線865,對應于學習對象非面部圖像的曲線在曲線866中示出,并且對應于學習對 象正面面部圖像的曲線在曲線867中示出。也就是說,在閾值thlO或以下處,非面部和面 部的權(quán)重分布狀態(tài)是混合的,從而認為區(qū)分是困難的。然而,在閾值thlO或更大處,幾乎沒 有非面部權(quán)重分布,并且面部權(quán)重的分布是其大多數(shù),從而可以使得區(qū)分相對清楚。即使在 此情況下,通過使用根據(jù)在閾值10th以上/以下而不同的權(quán)重可以非常有效地檢測面部。 因此,可減小弱假設(shè),從而可快速地執(zhí)行面部檢測處理。此外,即使在減小弱假設(shè)的情況下, 也可增加面部檢測精度。 在使用由此創(chuàng)建的面部檢測字典821來執(zhí)行面部檢測處理的情況下,面部檢測字典821中包括的從t = l到T的各種信息用于關(guān)于要檢測的圖像x(24像素X24像素),根 據(jù)下面的表達式10來計算最終假設(shè)H(x)。依賴于H(x)》0還是H(x) <0,確定面部是否 包括在要檢測的圖像x中。
T <formula>formula see original document page 19</formula>
以下將示出在表達式7和8用于計算表達式10中示出的最終假設(shè)H(x)、并且執(zhí)行
面部確定的情況下的流程。
<formula>formula see original document page 19</formula>
例如,在對圖像x執(zhí)行面部檢測處理的情況下,對應于面部檢測字典821中包括的 第t行中的位置l(ul, vl)822和位置2(u2, v2)823,提取圖像x上的兩點的亮度值。接下 來,計算兩點之間的亮度的差值,并且比較該差值和面部檢測字典821的閾值(e )824中存 儲的值。例如,在兩點之間的亮度的差值是Dt、并且閾值(e)824中存儲的值是tht的情 況下,如果Dt > tht,則選擇權(quán)重(a )825的(H)中存儲的值(即,表達式7中所示的權(quán)重 hH(x))。另一方面,如果Dt < tht,則選擇權(quán)重(a)825的(L)中存儲的值(即,表達式8 中所示的權(quán)重K (x))。對于從t = 1到T的每個權(quán)重(a ) 825,通過將選擇的權(quán)重(a ) 825 的值(H或L)順序相加,計算最終假設(shè)H(x)。在H(x) <0的情況下,確定面部不包括在要 檢測的圖像x中,而在H(x)》0的情況下,確定面部包括在要檢測的圖像x中。注意,將參 照圖22A到25C詳細描述面部確定處理。
用于檢測多個不同對象的字典創(chuàng)建示例 上面示出了使用其中包括用作對象的人的面部的學習對象正面面部圖像、和其中 不包括人的面部的學習對象非面部圖像來創(chuàng)建面部檢測字典的示例。然而,通過應用上述 計算方法,可創(chuàng)建用于同時執(zhí)行檢測處理多個不同對象的字典。具體地,在對多個不同對象 執(zhí)行檢測處理的情況下,對多個不同對象的每個,可創(chuàng)建用于同時執(zhí)行評估值的計算的字 典,其中,在確定這些對象是否包括在圖像中的情況下使用所述評估值。也就是說,可創(chuàng)建 用于對多個類同時執(zhí)行確定處理的字典。下面將描述創(chuàng)建用于對作為多個不同對象的正面
n
...表達式7
...表達式8
P,面部和左側(cè)面面部同時執(zhí)行檢測處理的面部檢測字典的示例。注意,功能配置與圖4所示的功能配置類似,所以將附上相同的參考標號,將主要對不同功能給出描述,并將省略其他描述。 圖12A到12C是示出用作根據(jù)本發(fā)明第一實施例的學習設(shè)備800的學習對象的學習對象圖像的示例的圖。圖12A示出由多個學習對象正面面部圖像組成的學習對象正面面部圖像組830,并且圖12B示出由多個學習對象側(cè)面圖像組成的學習對象側(cè)面圖像組870。此外,圖12C示出由多個學習對象非面部圖像組成的學習對象非面部圖像組840。注意,圖12A和12C中示出的學習對象正面面部圖像組830和學習對象非面部圖像組840與圖5A和5B中示出的學習對象正面面部圖像組830和學習對象非面部圖像組840相同。因此,對于這些,將附上與圖5A和5B中的相同的參考標號,并且即使在圖12A到12C所示的示例中,為了描述方便,也將顯示簡化的圖像作為學習對象圖像。 如圖12B中所示的學習對象側(cè)面圖像871到874,例如,包括人的面部(左側(cè)面部)的大量樣本圖像用作學習對象側(cè)面圖像。此外,在該示例中,將描述使用大約IO,OOO個學習對象正面面部圖像、大約10, 000個學習對象側(cè)面圖像和大約100, 000個學習對象非面部圖像來創(chuàng)建面部檢測字典的示例。這些學習對象圖像按種類順序輸入到學習對象圖像輸入單元801。 圖13A和13B是示出根據(jù)本發(fā)明第一實施例的權(quán)重保持單元810的保持內(nèi)容的模型的圖。圖13A和13B中所示的權(quán)重保持單元810中保持的各項目與圖6A和6B中所示的權(quán)重保持單元810中的相同,除了其中添加類信息814并按每類保持權(quán)重的這些點外。因此,在配置與圖6A和6B類似處,將附上相同的參考標號,將主要對于不同功能給出描述,并將省略其他描述。圖13A示出其中在權(quán)重保持單元810中保持權(quán)重的學習對象圖像,并且圖13B示出對應于學習對象圖像的權(quán)重保持單元810的保持內(nèi)容。此夕卜,圖13A和13B的相關(guān)性示出為用箭頭連結(jié)在一起。注意,圖12A到12C中示出的學習對象圖像的一部分示出為學習對象側(cè)面圖像組870等中包括的學習對象圖像,并且對相同學習對象圖像附上相同參考標號。此外,在該示例的情況下,描述了學習對象正面面部圖像組830中包括的圖像的數(shù)量和學習對象側(cè)面圖像組870中包括的圖像的數(shù)量相同的情況的示例。
用于區(qū)分學習對象圖像的Xi(i是滿足1《i《K的整數(shù))保持在學習對象圖像區(qū)分信息(Xi)811中。圖13B示出的示例示出了學習對象正面面部圖像組830和學習對象非面部圖像組840中包括的圖像的總數(shù)是K、并且學習對象側(cè)面圖像組870和學習對象非面部圖像組840中包括的圖像的總數(shù)是K的情況。例如,設(shè)K二 110, 000。此外,例如,^與學習對象側(cè)面圖像871相關(guān)并且保持在學習對象圖像區(qū)分信息(Xi)811中。
如上所述,權(quán)重按每個類保持在權(quán)重(Wi,e/)812中。也就是說,如圖13B所示,按照學習對象正面面部圖像組830和學習對象非面部圖像組840中包括的各學習對象圖像、以及學習對象側(cè)面圖像組870和學習對象非面部圖像組840中包括的各學習對象圖像的每個類保持權(quán)重?,F(xiàn)在,將對學習對象非面部圖像組840中包括的各學習對象圖像的每個類使用共同圖像,但通過權(quán)重更新單元807順序更新的權(quán)重變?yōu)椴煌?。此外,對緊接在后面輸入到學習對象圖像輸入單元801中的每個學習對象圖像給出相同值(1/K)作為權(quán)重(Wi,」)。此夕卜,例如,Wl。?與學習對象側(cè)面圖像871相關(guān)并保持在(Wi,。/)812中?,F(xiàn)在,Cj對應于類信息(c,.)814中的c,.,并且表示所屬的類。
在面部圖像/非面部圖像標識信息(y》813中,類似于學習對象正面面部圖像,"l"保持在學習對象側(cè)面圖像中。例如,使"1"與學習對象側(cè)面圖像871相關(guān)并保持在面部圖像/非面部圖像標識信息(y》813中。 類信息(Cj)814是用于標識類的信息,并且例如,"c/,保持在學習對象正面面部圖像中,并且"c/保持在學習對象側(cè)面圖像中。此外,"c/'保持在屬于學習對象正面面部圖像的類的學習對象非面部圖像的權(quán)重中,并且"c/保持在屬于學習對象側(cè)面圖像的類的學習對象非面部圖像的權(quán)重中。例如,"c/'保持在屬于學習對象正面面部圖像的類的學習對象非面部圖像844的權(quán)重中,并且"c/,保持在屬于學習對象側(cè)面圖像的類的學習對象非面部圖像844的權(quán)重中。 圖14A到14C是示意性示出根據(jù)本發(fā)明第一實施例、通過權(quán)重分布創(chuàng)建單元803創(chuàng)建權(quán)重分布信息的方法的圖。圖14A到14C所示的示例是圖7A和7B的修改示例,并且除了創(chuàng)建關(guān)于學習對象正面面部圖像和學習對象非面部圖像的權(quán)重分布信息外,與圖7A和7B不同的點在于,創(chuàng)建關(guān)于學習對象側(cè)面圖像和學習對象非面部圖像的權(quán)重分布信息。因此,在其中配置類似時將附上相同的參考標號,并將省略描述,并且將主要對于與圖7A和7B不同的部分給出描述。 如圖14A所示,每個學習對象圖像上的兩點之間的亮度的差值的計算方法類似于圖7A所示的情況。此外,如圖14B所示,用于基于每個學習對象正面面部圖像和學習對象非面部圖像之間的亮度的差值創(chuàng)建權(quán)重分布信息的創(chuàng)建方法類似于圖7B所示的示例。
圖14C所示的權(quán)重分布信息與圖7B所示的示例的不同在于,圖14C所示的權(quán)重分布信息是關(guān)于學習對象側(cè)面圖像和學習對象非面部圖像的權(quán)重分布信息。然而,基于每個學習對象側(cè)面圖像和學習對象非面部圖像上的兩點之間的亮度的差值的權(quán)重分布信息的創(chuàng)建方法類似于圖7B所示的示例。 具體地,權(quán)重分布信息創(chuàng)建單元803將與對其計算差值的學習對象圖像相關(guān)并保持在權(quán)重保持單元810中的權(quán)重(Wi,。/)、與通過亮度差值計算單元802計算的差值的級別相加。對每個類執(zhí)行相加處理。也就是說,對關(guān)于圖14B所示的學習對象正面面部圖像和學習對象非面部圖像的權(quán)重分布曲線圖、以及關(guān)于圖14C所示的學習對象側(cè)面圖像和學習對象非面部圖像的權(quán)重分布曲線圖執(zhí)行相加處理。例如,如圖14B所示,對應于每個學習對象圖像的權(quán)重(Wl。/,Wk,。/)與對學習對象正面面部圖像831和學習對象非面部圖像844計算的差值的級別相加。此外,如圖14C所示,對應于每個學習對象圖像的權(quán)重(Wl二Wk,J)與對學習對象側(cè)面圖像871和學習對象非面部圖像844計算的差值的級別相加。因此,對于學習對象非面部圖像,對于圖14B所示的權(quán)重分布曲線圖和圖14C所示的權(quán)重分布曲線圖同時執(zhí)行相加處理。此外,對于學習對象圖像,類似地,將對應于每個學習對象圖像的權(quán)重(W"jt)與計算的差值的級別順序相加,并且創(chuàng)建權(quán)重分布信息。此外,對于學習對象圖像上的兩個其他點的組合(對),類似地,將與每個學習對象圖像相關(guān)的權(quán)重(W"順序相加,并且創(chuàng)建權(quán)重分布信息。因此,圖15A和15B中示出對每個學習對象圖像上的兩點(像素位置Pll和P12)的組合創(chuàng)建的權(quán)重分布信息的示例。 圖15A和15B是示意性示出根據(jù)本發(fā)明第一實施例、通過權(quán)重分布信息創(chuàng)建單元803創(chuàng)建的權(quán)重分布信息與學習對象圖像之間的關(guān)系的圖。圖15A示出學習對象正面面部圖像組830、學習對象側(cè)面圖像組870和學習對象非面部圖像組840中包括的學習對象圖像。這些學習對象圖像類似于圖12A到12C中的一部分。 圖15B示出對兩點(像素位置P11和P12)的組合創(chuàng)建的權(quán)重分布曲線(權(quán)重分布信息)875和876。如圖14B所示,權(quán)重分布曲線875是對學習對象正面面部圖像組和學習對象非面部圖像組中包括的每種學習對象圖像、通過將對每個順序相加的級別的權(quán)重(Wi,c/)的乘積值連結(jié)在一起而創(chuàng)建的曲線。此外,如圖14C所示,權(quán)重分布曲線876是對學習對象側(cè)面圖像組和學習對象非面部圖像組中包括的每種學習對象圖像、通過將對每個順序相加的級別的權(quán)重(Wi,。。的乘積值連結(jié)在一起而創(chuàng)建的曲線。利用這些權(quán)重分布曲線,可以理解根據(jù)學習對象圖像的種類的特性權(quán)重分布狀態(tài)。 此外,利用這些分布曲線,可以對正面面部圖像和非面部圖像、以及左側(cè)面面部圖像和非面部圖像的每個獲得獨立的權(quán)重分布。例如,利用權(quán)重分布曲線875,設(shè)在右側(cè)的以鐘形生成的曲線是對應于正面面部圖像的曲線,并且在左側(cè)以鐘形生成的曲線是對應于非面部圖像的曲線。此外,利用權(quán)重分布曲線876,設(shè)在右側(cè)的以鐘形生成的曲線是對應于左側(cè)面面部圖像的曲線,并且在左側(cè)的以鐘形生成的曲線是對應于非面部圖像的曲線。例如,在權(quán)重分布曲線875和876中,在對應于非面部圖像的曲線是t = 1的情況下,要相加的學習對象圖像是相同的,并因此共同保持。此外,例如,在權(quán)重分布曲線875和876中,對應于正面面部圖像的曲線和對應于左側(cè)面面部圖像的曲線具有不同的要相加的學習對象圖像,從而是相互不同的曲線。 現(xiàn)在將描述用于區(qū)分正面面部、左側(cè)面面部和非面部之間的閾值的確定方法。例如,設(shè)圖15B所示的權(quán)重分布曲線875和876的垂直軸的值是d(d是滿足-255《d《255的整數(shù))并且水平軸的常數(shù)是thll (thll是滿足-255《thl《255的整數(shù))。在此情況下,設(shè)小于常數(shù)thll的學習對象正面面部圖像的權(quán)重分布曲線上的值是P^+(d),并且等于或大于常數(shù)thll的學習對象正面面部圖像的權(quán)重分布曲線上的值是?/+((1)。此外,小于常數(shù)thll的學習對象側(cè)面面部圖像的權(quán)重分布曲線上的值是P,+ (d),并且等于或大于常數(shù)讓11的學習對象側(cè)面面部圖像的權(quán)重分布曲線上的值是?/+((1)。此外,對于類(c》,設(shè)小于常數(shù)thll的學習對象非面部圖像的權(quán)重分布曲線上的值是PJ1—(d),并且等于或大于常數(shù)thll的學習對象非面部圖像的權(quán)重分布曲線上的值是P/—(d)。此外,對于類(c》,設(shè)小于常數(shù)thll的學習對象非面部圖像的權(quán)重分布曲線上的值是PJ2—(d),并且等于或大于常數(shù)thll的學習對象非面部圖像的權(quán)重分布曲線上的值是P/—(d)。 在此情況下,對于權(quán)重分布曲線875和876的每個,最佳閾值確定單元804計算常數(shù)thll的兩側(cè)上的權(quán)重分布的總和。例如,對于權(quán)重分布曲線875,使用下面的表達式11到14,計算總和P/+、 P,+、 P/1—和PJ1—。 P P
cl+H
cl+
255
s:]
d-thllthll
d=-255
表達式11
表達式12
255
n cl一 r 一cl一,、 Pu = SPh (d)
H
表達式13 P
cl-L PH = PL = PH 二
nC2- =
d-thll thll
J) P廣(d)…表達式14 d=-255 此外,例如對于權(quán)重分布曲線876,使用下面的表達式15到18,計算總和P/2+、
PLc2+、PHc2—和PLc2—。
255
Z PH (d)…表達式15
d=thll thll
" c2+
J] PL (d)…表達式16
d=-255 255
Z P, ""(d)...表達式17
<formula>formula see original document page 23</formula>
J) _(d)...表達式18 d=-255 現(xiàn)在,如上所述,在權(quán)重分布曲線875和876中,在t = 1的情況下,對應于非面部 圖像的曲線是相同的,從而表達式13所示的P/1—和表達式17所示的P/2—是相同的值。類 似地,在t = 1的情況下,表達式14所示的PJ1—和表達式18所示的PJ2—是相同的值。
接下來,最佳閾值確定單元804使用下面的表達式19,利用計算的權(quán)重分布總和 PHcl+、 Pj1+、 P/—、 PJ1—、 P/2+、 P,+、 P/2—和PJ2—,計算值Tl 1 。
T11 =((PLc1+ x PLc1_) +V"(PHc1+ x PHc1—) +VT(PLC2+xPLC2-)+vr(PHC2+xpHC2-)。表達式19 接下來,最佳閾值確定單元804將其中計算的值Til是最小的常數(shù)thll確定為關(guān) 于圖15B所示的權(quán)重分布曲線875和876對應的兩點(像素位置Pll和P12)的組合的閾 值thll。此外,對于學習對象圖像上的兩點的其他組合(對),類似地,可以使用權(quán)重分布 曲線(權(quán)重分布信息)確定閾值。因此,對于每個學習對象圖像上的兩點的組合,在圖16A 和16B中示出創(chuàng)建的權(quán)重分布信息和基于權(quán)重分布信息確定的閾值的示例。
圖16A和16B是示意性示出根據(jù)本發(fā)明第一實施例、通過權(quán)重分布信息創(chuàng)建單元 803創(chuàng)建的權(quán)重分布信息和通過最佳閾值確定單元804確定的閾值之間的關(guān)系的圖。此外, 圖16A和16B示出權(quán)重分布信息和閾值、以及與此對應的學習對象圖像上的兩點的組合。注 意,在圖16A和16B中,在學習對象正面面部圖像組830、學習對象側(cè)面圖像組870和學習對 象非面部圖像組840中包括的各學習對象圖像中,僅示出學習對象正面面部圖像831、學習 對象側(cè)面圖像871和學習對象非面部圖像844。此外,圖16A中所示的學習對象圖像上的兩點的組合、權(quán)重分布信息和閾值之間的關(guān)系類似于圖15A和15B中所示的關(guān)系。 圖16B示出對學習對象圖像上的兩點(像素位置Pq 1和Pq2)的組合創(chuàng)建的權(quán)重
分布曲線877和878、和基于權(quán)重分布曲線877和878確定的閾值thql之間的關(guān)系。 因此,對學習對象圖像上的兩點的每個組合(對),最佳閾值確定單元804使用權(quán)
重分布信息來確定閾值thll到thql。接下來,弱假設(shè)確定單元805確定所確定的閾值th11
到thql當中使用上述表達式19計算的閾值Tll為最小的閾值。將對應于所確定的閾值的
權(quán)重分布信息的弱假設(shè)確定為最佳弱假設(shè)。 圖17A到圖17C是示意性示出根據(jù)本發(fā)明第一實施例、用于將對應于通過弱假設(shè) 確定單元805確定的弱假設(shè)的各個值記錄在面部檢測字典中的記錄方法的圖。圖17A示出 對應于通過弱假設(shè)確定單元805確定的閾值thrll和學習對象圖像上的兩點(像素位置 Prll和Pr12)的組合的權(quán)重分布曲線880和881。注意,在圖17A中,示出閾值thrll的位 置的線是粗線。此外,對于權(quán)重分布曲線880(類c》,對應于學習對象非面部圖像的曲線 用曲線882示出,并且對應于學習對象正面面部圖像的曲線用曲線883示出。此外,對于權(quán) 重分布曲線881 (類c2),對應于學習對象非面部圖像的曲線用曲線884示出,并且對應于 學習對象側(cè)面面部圖像的曲線用曲線885示出。 圖17B示出用于計算關(guān)于通過弱假設(shè)確定單元805確定的閾值thr11的四個權(quán)重 的權(quán)重計算單元806。權(quán)重計算單元806基于權(quán)重分布曲線880和881的閾值thrll的兩側(cè) 上的權(quán)重分布的總和,計算關(guān)于正面面部的權(quán)重h(x, Cl)和關(guān)于左面面部的權(quán)重h(x, c2)。 對于閾值thrll的兩側(cè)的每個權(quán)重分布的總和是P/1+、 Pj1+、 P/1—、 PJ1—、 P/+、 P,+、 P/2—和 PLc2—。此外,關(guān)于正面面部的權(quán)重h(x,c》是兩個權(quán)重W(x,c》和hjx,c》,并且關(guān)于左側(cè) 面面部的權(quán)重h(x, c2)是兩個權(quán)重W(x, c2)和hjx, c2)。具體地,基于權(quán)重分布曲線880 的閾值thrll的兩側(cè)上的權(quán)重分布的總和,使用下面的表達式20和21計算權(quán)重h(x, Cl)。 此外,基于權(quán)重分布曲線881的閾值thrll的兩側(cè)上的權(quán)重分布的總和,使用下面的表達式 22和23計算權(quán)重h(x, c2)。注意,表達式20到23中所示的x用于區(qū)分要檢測的圖像。
<formula>formula see original document page 24</formula><formula>formula see original document page 25</formula> 圖17C示出其中將對應于通過弱假設(shè)確定單元805確定的弱假設(shè)的各個值記錄在 面部檢測字典826中的示例的模型。面部檢測字典826存儲在面部檢測字典存儲單元820 中。具體地,通過弱假設(shè)確定單元805確定的閾值thrll的值記錄在面部檢測字典826的 閾值(e)824中。此外,在對應于閾值thrll的兩點(像素位置Prll和Prl2)的組合中, 將其中一點(像素位置Prll)記錄在面部檢測字典826的位置l(ul, vl)822中。此外,在 對應于閾值thrll的兩點(像素位置Prll和Prl2)的組合中,將另一點(像素位置Prl2) 記錄在面部檢測字典826的位置2(u2,v2)823中。此外,將對閾值thrll計算的權(quán)重h(x, c》和權(quán)重h(x,c》記錄在面部檢測字典826的權(quán)重(a l和a 2)827中。例如,將權(quán)重h(x, c》的hH(x,c》記錄在權(quán)重(a 1)827的(H)中,并且權(quán)重h (x, Cl)的hjx,c》記錄在權(quán)重 (a 1)827的(L)中。此外,將權(quán)重h(x,C2) WhH(x,c2)記錄在權(quán)重(a 2)827的(H)中,并 且將權(quán)重h(x, c2)的hjx, c2)記錄在權(quán)重(a 2)827的(L)中。這里的各種值通過記錄控 制單元808記錄在面部檢測字典826中。 接下來,權(quán)重更新單元807使用下面的表達式24來計算要加權(quán)到每個學習對象圖 像的權(quán)重Wi,。/、并且更新權(quán)重保持單元810中保持的權(quán)重。 " cj — K ...表達式24
<formula>formula see original document page 25</formula> 現(xiàn)在,Wi,。/和yi是與學習對象圖像Xi相關(guān)并保持在權(quán)重保持單元810中的值(圖 13A和13B中所示)。此外,ht(Xi,Ci)是根據(jù)每個學習對象圖像的亮度的差值確定的值,所 述每個學習對象圖像是對于與通過弱假設(shè)確定單元805確定的閾值thrll對應的兩點(像 素位置Prll和Pr12)的組合計算的?,F(xiàn)在,Ci與學習對象圖像Xi相關(guān),并表示在權(quán)重保持 單元810中保持的類(圖13A和13B所示)。具體地,在"c/'與學習對象圖像Xi相關(guān)并存 儲在權(quán)重保持單元810中保持的類信息(Ci)814中的情況下,使用表達式20或21之一的 權(quán)重h(x, Cl)。此外,在"c/與學習對象圖像Xi相關(guān)并存儲在權(quán)重保持單元810中保持的 類信息(Ci)814中的情況下,使用表達式22或23之一的權(quán)重h(x, c2)?,F(xiàn)在,設(shè)對學習對 象圖像Xi中的兩點(像素位置Prll和Pr12)的組合計算的亮度的差值是差值Pd。例如, 在類信息(Ci)814是"c/,的情況下,在Pd > thrll成立的情況下,則使用表達式20中所 示的hjx, Cl)。另一方面,在PcK thrll成立的情況下,則使用表達式21中所示的hjx, Cl)。此外,在類信息(Ci)814是"c/,的情況下,在Pd^thrll成立的情況下,則使用表達式22中所示的K(x, c2)。另一方面,在PcKthrll成立的情況下,則使用表達式23中所
示的K(X,C》。因此,根據(jù)亮度的差值選擇ht(Xi,Ci)。因此,例如,對于已經(jīng)被不同地區(qū)分
的學習對象圖像,使用通過弱假設(shè)確定單元805確定的閾值作為基礎(chǔ),可以使得權(quán)重更重, 并且因此可更容易地用下面的循環(huán)反映。因此,對緊接在后面輸入到學習對象圖像輸入單 元801的每個學習對象圖像給出相同的值(1/K)作為權(quán)重(Wi,。/),但是根據(jù)每個學習對象 圖像修改對于t = 2及此后的權(quán)重(Wi,。/)。 接下來,重復上述處理,直到實現(xiàn)期望的循環(huán)數(shù),或直到實現(xiàn)期望的精度。 因此,根據(jù)本發(fā)明第一實施例,即使在兩個或更多對象的情況下,也可根據(jù)通過弱
假設(shè)確定單元805確定的閾值的增加/減小計算不同的權(quán)重。因此,在同時檢測多個對象
的面部檢測處理中,即使對難以區(qū)分的圖像也可以容易地進行檢測,并且可以改進面部檢
測精度。 此外,在上述示例中,描述了創(chuàng)建用于檢測正面面部和左側(cè)面面部的兩個對象的 對象檢測字典的示例。然而,該示例可應用于創(chuàng)建用于檢測三個或更多對象的對象檢測字 典。在此情況下,可使用下面的表達式25和26計算每個類(Ci)的權(quán)重h(x,Cj)。
hH(x
h(x,
hL(x 此外,在上面示出的示例中,描述了其中多個對象是面向不同方向的人的面部的 示例,但是例如,該示例可應用到創(chuàng)建關(guān)于不同種類(如狗和貓)的多個對象的對象檢測字 典的情況。此外,該示例可應用到創(chuàng)建用于確定屬性(如區(qū)分男性和女性,或區(qū)分年齡范 圍)的屬性確定字典的情況。 在使用由此創(chuàng)建的面部檢測字典826來執(zhí)行面部檢測處理的情況下,使用面部檢 測字典826中包括的t = 1到T的各種信息,對用作檢測對象的圖像x (24像素X 24像素) 計算關(guān)于兩個對象的最終假設(shè)。也就是說,使用下面的表達式27和28,計算關(guān)于正面面部 的最終假設(shè)H(x,c》和關(guān)于左側(cè)面面部的最終假設(shè)H(x,c》。依賴于H(x,c》》0還是H(x, c》〈0,確定正面面部是否包括在用作檢測對象的圉像x中。此外,依賴于H(x,c》>0還 是H(x, c2) 〈0,確定左側(cè)面部是否包括在用作檢測對象的圉像x中。注意,將參照圖22A 到25C詳細描述這里的面部確定。
T
Cl)= S h (x, Cl).表達式27 t=i
T
c2) = S h(x, c2)...表達式28 t=i 因此,根據(jù)本發(fā)明第一實施例,可使用相同的亮度差值同時執(zhí)行關(guān)于兩個不同對
26
...表達式25
...表達式26 H(x
H ( x象的確定處理。因此,可快速地執(zhí)行面部檢測處理。
學習設(shè)備的操作示例 接下來,將參照附圖描述根據(jù)本發(fā)明第一實施例的學習設(shè)備800的操作。
圖18是示出根據(jù)本發(fā)明第一實施例、通過學習設(shè)備800進行的對象檢測字典創(chuàng)建 處理的處理過程的流程圖。在該示例中,將描述創(chuàng)建用于檢測作為對象的正面面部的面部 檢測字典的示例。與該示例一起,還將描述其中重復對象檢測字典創(chuàng)建處理直到實現(xiàn)期望 的次數(shù)的示例。 首先,將多個學習對象正面面部圖像和學習對象非面部圖像輸入到學習對象圖像 輸入單元801 (步驟S1001)。接下來,權(quán)重更新單元807將對每個學習對象圖像加權(quán)的權(quán)重 (W"初始化(步驟S1002)。也就是說,在每個學習對象圖像中,相同的值加權(quán)為權(quán)重(W"。 接下來,執(zhí)行弱假設(shè)確定處理(步驟S1010)。將參照圖19詳細描述弱假設(shè)確定處理。
接下來,權(quán)重計算單元806基于對應于確定的最佳弱假設(shè)的權(quán)重分布信息計算權(quán) 重(步驟S1003)。接下來,記錄控制單元808將對應于確定的弱假設(shè)的兩點(兩點的像素 位置)的組合、閾值和權(quán)重值記錄在面部檢測字典中(步驟S1004)。接下來,權(quán)重更新單元 807基于確定的弱假設(shè),計算要對每個學習對象圖像加權(quán)的權(quán)重W,1,并更新權(quán)重保持單元 810中保持的權(quán)重(步驟S1005)。接下來,確定是否已經(jīng)實現(xiàn)期望的次數(shù)(步驟S1006),并 且在還沒有實現(xiàn)該次數(shù)的情況下(步驟S1006),流程返回到步驟S1010。另一方面,在已經(jīng) 實現(xiàn)期望的次數(shù)的情況下(步驟S1006),結(jié)束對象檢測字典創(chuàng)建處理的操作。
圖19是示出根據(jù)本發(fā)明第一實施例、在通過學習設(shè)備800進行的對象檢測字典創(chuàng) 建處理的處理過程中的弱假設(shè)確定處理過程(圖18所示的步驟S1010中的處理過程)的 流程圖。 首先,亮度差值計算單元802選擇每個學習對象圖像上的像素位置的兩點的一個 組合(對)(步驟S1011),并且選擇用作對象的一個學習對象圖像用于權(quán)重相加(S1012)。 接下來,亮度差值計算單元802提取選擇的學習對象圖像上的兩點之間的亮度(步驟 S1013),并且計算提取的兩點的亮度的差值(步驟S1014)。接下來,權(quán)重分布信息創(chuàng)建單元 803將下述權(quán)重與計算的差值的級別相加,在所述權(quán)重中差值與計算的學習對象圖像相關(guān), 并且所述權(quán)重保持在權(quán)重保持單元810中(步驟S1015)。在權(quán)重相加處理中,按照每種學 習對象圖像將權(quán)重相加,并且對每種學習對象圖像創(chuàng)建權(quán)重分布信息。
接下來,對于學習對象圖像輸入單元801中輸入的學習對象正面面部圖像和學習 對象非面部圖像的全部,確定是否執(zhí)行關(guān)于相同兩點的權(quán)重相加處理(步驟S 1016)。在沒 有對學習對象正面面部圖像和學習對象非面部圖像的全部執(zhí)行關(guān)于相同兩點的權(quán)重相加 處理的情況下(步驟S1016),流程返回到步驟S1012。另一方面,在執(zhí)行關(guān)于相同兩點的權(quán) 重相加處理的情況下(步驟S1016),最佳閾值確定單元804使用上述表達式6來確定對創(chuàng) 建的權(quán)重分布信息的最佳閾值(步驟S1017)。 接下來,確定是否對每個學習對象圖像上的像素位置的兩點的所有組合創(chuàng)建權(quán)重 分布信息(步驟S1018)。在沒有對像素位置的兩點的所有組合創(chuàng)建權(quán)重分布信息的情況下 (步驟S1018),流程返回到步驟SlOll。另一方面,在對像素位置的兩點的所有組合創(chuàng)建權(quán) 重分布信息的情況下(步驟S1018),弱假設(shè)確定單元805基于確定的最佳閾值確定最佳弱 假設(shè)(步驟S1019)。
27
接下來,將參照附圖詳細描述將可通過學習設(shè)備800創(chuàng)建的各種字典提供給成像
設(shè)備ioo的示例。 評估值計算字典的配置示例 圖20A和20B是示出根據(jù)本發(fā)明第一實施例、用于計算確定對象圖像的多個評估 值的評估值計算字典的示例的圖。圖20A示出包括圖像601到609的對象圖像組600,所 述圖像601到609表示要對其計算評估值的多個對象?,F(xiàn)在,根據(jù)本發(fā)明第一實施例,將描 述作為多個對象的面向各個方向的人的面部的示例。也就是說,圖像601到609是表示面 向各個方向的人的面部的圖像。例如,圖像605是包括面向前面的面部的圖像,圖像601到 604和606到609是包括面向前面以外的方向的面部的圖像。 圖20B示出用于同時計算對應于圖20A所示的圖像601到609的各評估值的評估 值計算字典301。評估值計算字典301是用于通過評估值計算單元235對于通過圖像提取 單元233提取的確定對象圖像(例如,矢量形式弱假設(shè))執(zhí)行評估值計算處理的確定信息, 并且存儲在評估值計算字典存儲單元300中。此外,例如通過學習設(shè)備800創(chuàng)建評估值計 算字典301中存儲的各值。此外,評估值計算字典301是僅保持關(guān)于確定標準的數(shù)據(jù)的確 定信息,并且不保持圖像自身。因此,可減小存儲容量,并可快速執(zhí)行確定處理。
將位置1(ul,vl)302、位置2(u2,v2)303、閾值(e ) 304和權(quán)重(a 1到a 9)305的 T組組合存儲在評估值計算字典301中。 位置l(ul, vl)302和位置2(u2, v2) 303是確定對象圖像上的兩點的位置?,F(xiàn)在, 例如,在確定對象圖像上的左上角是原點的情況下,設(shè)確定對象圖像的水平方向上的位置 是ul和u2,并且垂直方向上的位置是vl和v2。 閾值(9)304是關(guān)于位置l(ul,v1)302的亮度值和位置2(u2,v2)303的亮度值之 間的差值的閾值。 權(quán)重(a 1到a 9) 305是基于位置1 (ul, vl) 302的亮度值和位置2 (u2, v2) 303的 亮度值之間的差值和閾值(9 )304的比較結(jié)果相加的權(quán)重a 1至IJ a 9。權(quán)重a 1至lj a 9是 用于計算對應于圖20A所示的圖像601到609的各評估值的值,并且在圖20A和20B中,圖 20B中所示的圖像601到609與對應的權(quán)重a 1到a 9被示出為用箭頭連結(jié)在一起。此外, 對于權(quán)重a 1到a 9的每個,存儲兩個不同值(H和L)。 現(xiàn)在,評估值計算字典301用于計算用于縮窄要經(jīng)歷通過圖21A和21B所示的面 部確定字典311到319的面部確定處理的對象的評估值,并且不獨立地執(zhí)行面部檢測。因 此,評估值計算字典301具有比用于面部確定字典311到319的評估值的計算精度更松的 條件。例如,在創(chuàng)建評估值計算字典301的情況下,使用幾千個到幾萬個樣本圖像,從而大 致設(shè)T二 100。注意,根據(jù)本發(fā)明第一實施例,示出了使用公共值作為對于每個記錄的閾值 的示例,但是可使用根據(jù)每個對象(類)修改的閾值。此外,例如,在創(chuàng)建同時計算關(guān)于多 個對象的評估值的評估值計算字典的情況下,可假設(shè)用于各對象的樣本圖像的數(shù)量極大不 同的情況。在此情況下,在評估值計算處理的情況下,可根據(jù)樣本圖像的數(shù)量執(zhí)行規(guī)范化或 調(diào)整操作等。注意,將參照圖23A和23B等詳細描述使用每個值執(zhí)行的評估值的計算。
面部確定字典的配置示例 圖21A和21B是示出根據(jù)本發(fā)明第一實施例、用于確定面部是否包括在確定對象 圖像中的面部確定字典的示例的圖。圖21A示出用于計算對應于圖20A和21B中所示的圖像601到609的評估值并執(zhí)行面部確定的面部確定字典311到319。面部確定字典311到 319是用于通過面部確定單元237對通過圖像提取單元233提取的確定對象圖像執(zhí)行面部 確定處理的確定信息(例如,標量型弱假設(shè)),并且存儲在面部確定字典存儲單元310中。 此外,面部確定字典311到319中存儲的各值例如通過學習設(shè)備800創(chuàng)建。注意,面部確定 字典311到319是僅保持關(guān)于確定標準的數(shù)據(jù)的確定信息,并且不保持圖像自身。因此,可 減小存儲容量,同時可快速執(zhí)行確定處理。面部確定字典311到319具有對每個項目不同 的值,但是每個項目的格式相同。因此,在圖21A中,僅表示和示出面部確定字典311和319 的存儲內(nèi)容,并且從圖中省略其他的存儲內(nèi)容。注意,圖21B中示出的圖像601到609與圖 20A中示出的圖像601到609相同,并且是示出要確定的多個對象的圖像。此外,在圖21A 和21B中,圖21B中示出的圖像601到609和對應的面部確定字典311到319示出為用箭 頭連結(jié)在一起。 位置l(ul, vl)321、位置2(u2, v2)322、閾值(e ) 323和權(quán)重(a ) 324的Z組組合 存儲在面部確定字典311中。位置l(ul, vl)321和位置2(u2, v2)322是確定對象圖像上 的兩點的位置。閾值(9 )323是關(guān)于位置l(ul, v1)321的亮度值和位置2(u2, v2) 322的 亮度值之間的差值的閾值。權(quán)重(a)324是基于位置1(ul,vl)321的亮度值和位置2(u2, v2)322的亮度值之間的差值和閾值(9 )323的比較結(jié)果而相加的權(quán)重a 。此外,將兩個不 同值(H和L)存儲在權(quán)重(a ) 324中。 現(xiàn)在,面部確定字典311到319具有比使用評估值計算字典301的評估值的計算 精度更嚴格的條件。例如,在創(chuàng)建面部確定字典311到319的情況下,使用幾萬個樣本圖像, 從而大致設(shè)Z = 2, 000到3, 000?,F(xiàn)在,例如,在創(chuàng)建計算關(guān)于多個對象的評估值的面部確 定字典的情況下,可假設(shè)用于各對象的樣本圖像的數(shù)量極大不同的情況。在此情況下,在評 估值計算處理的情況下,可根據(jù)樣本圖像的數(shù)量執(zhí)行規(guī)范化或調(diào)整操作等。此外,將參照圖 24A到24D等詳細描述使用每個值執(zhí)行的評估值的計算。
圖像中包括的面部的檢測示例 圖22A到22D是示出根據(jù)本發(fā)明第一實施例、用于提取要經(jīng)歷面部檢測單元230 的面部檢測處理的確定對象圖像的圖像提取方法的概述的圖。圖22A示出通過圖像獲得單 元231獲得的成像圖像400,并且圖22B到22D示出經(jīng)歷圖像縮小單元232的縮小處理的、 從成像圖像400得到的圖像410、420和430。注意,通過圖像提取單元233執(zhí)行確定對象圖 像的提取。 圖22A所示的成像圖像400是其中面向相互不同的方向的三個人是被攝體的成像 圖像。在從成像圖像400提取確定對象圖像的情況下,如圖22B到22D所示,生成通過圖 像縮小單元232順序縮小成像圖像400的圖像410、420和430。例如,提取框401位于圖 像410的左上角,并且提取提取框401中包括的圖像。接下來,提取框在右側(cè)方向(通過箭 頭411和412指示的方向)偏移一像素,并且提取提取框中包括的圖像。類似地,提取框每 次在右側(cè)方向順序偏移一像素,并且順序提取提取框中包括的圖像。在提取在偏移到圖像 410的右邊緣位置的位置處的提取框中包括的圖像時,提取框向下偏移一像素,并移動到圖 像410的左邊緣。接下來,在緊接在后移動到圖像410的左邊緣的提取框中包括的圖像之 后,提取框每次在右側(cè)方向順序偏移一像素,并且順序提取提取框中包括的圖像。此后,類 似地順序提取提取框中包括的圖像。在提取框偏移到處于圖像410的右邊緣和下邊緣的位置413時,并且在提取位置413處的提取框中包括的圖像時,結(jié)束從圖像410進行的確定對 象圖像的提取處理。 此外,在圖22C和22D所示的圖像420和430中,示出了將提取框401定位在第一 定位位置中的示例,同時示出了提取框401的最終定位位置為位置421和431。注意,提取 框401從第一定位位置到最終定位位置的運動類似于圖22B所示的運動。此外,提取框401 的大小是恒定的,而不論要提取的圖像是否相同。執(zhí)行圖像提取處理,直到經(jīng)歷圖像縮小單 元232的縮小處理的圖像的大小變?yōu)樾∮谔崛】?01 。注意,經(jīng)歷縮小處理的原始圖像例如 是320像素X240像素的圖像。此外,通過圖像縮小單元232執(zhí)行的縮小處理可以是例如 將之前的圖像縮小0. 83倍的縮小處理。 接下來,將參照附圖詳細描述使用對確定對象圖像的評估值計算字典執(zhí)行評估值 計算處理的示例。 圖23A和23B是示出根據(jù)本發(fā)明第一實施例、通過圖像提取單元233提取的確定 對象圖像和通過評估值計算單元235關(guān)于確定對象圖像計算的評估值的示例的圖。圖23A 示出作為確定對象圖像的示例的確定對象圖像440。此外,在圖23A所示的示例中,給出了 使確定對象圖像440經(jīng)歷評估值計算處理的情況的示例的描述,其中確定對象圖像440的 左上角是原點,水平軸是u軸,并且垂直軸是v軸。 例如,設(shè)對應于存儲在圖20B所示的評估值計算字典301的第一行中的位置l(ul, v1)302的值的確定對象圖像440的位置是位置441,并且對應于位置2(u2, v2) 303的值的 確定對象圖像440的位置是位置442。此外,設(shè)對應于存儲在評估值計算字典301的第二行 中的位置1(ul,vl)302的值的確定對象圖像440的位置是位置443,并且對應于位置2(u2, v2)303的值的確定對象圖像440的位置是位置444。此外,設(shè)對應于存儲在評估值計算字 典301的第三行中的位置1 (ul, v1)302的值的確定對象圖像440的位置是位置445,并且 對應于位置2(u2, v2)303的值的確定對象圖像440的位置是位置446。
首先,示出評估值的分數(shù)Sl到S9的值設(shè)為0,并且執(zhí)行使用評估值計算字典301 的第一行中存儲的每個值的計算。具體地,提取存儲在評估值計算字典301的第一行中 的、在對應于位置l(ul, v1)302的值的位置441處的亮度值A(chǔ)(l)、以及對應于位置2(u2, v2) 303的值的位置442處的亮度值B (1)。使用下面的表達式,計算每個提取的亮度值的差 值C(l)。 C(l) = A(l)-B(l) 接下來,比較存儲在評估值計算字典301的第一行中的閾值(9 )304的閾值e (1)
和每個計算的亮度值的差值c(i),并且確定計算的差值c(i)是否小于閾值e (i)。在計算
的差值C(l)小于閾值(e ) 1的情況下,存儲在評估值計算字典301的第一行中的權(quán)重(a 1 到a 9)305中的L的各個值與對應的分數(shù)Sl到S9順序相加。具體地,權(quán)重a 1 (L)的值與 分數(shù)S1相加,權(quán)重a2(L)的值與分數(shù)S2相加,并且權(quán)重a3(L)的值與分數(shù)S3相加。此 外,權(quán)重a4(L)的值與分數(shù)S4相加,權(quán)重a5(L)的值與分數(shù)S5相加,并且權(quán)重a 6 (L)的 值與分數(shù)S6相加。此外,權(quán)重a7(L)的值與分數(shù)S7相加,權(quán)重a 8 (L)的值與分數(shù)S8相 加,并且權(quán)重a 9 (L)的值與分數(shù)S9相加。 另一方面,在計算的差值C(l)大于閾值e (1)的情況下,存儲在評估值計算字典 301的第一行中的權(quán)重(a 1到a 9) 305中的H的各個值與對應的分數(shù)Sl到S9順序相加。具體地,權(quán)重a 1(H)的值與分數(shù)Sl相加,權(quán)重a 2(H)的值與分數(shù)S2相加,并且權(quán)重a 3 (H) 的值與分數(shù)S3相加。此外,權(quán)重a 4(H)的值與分數(shù)S4相加,權(quán)重a 5 (H)的值與分數(shù)S5 相加,并且權(quán)重a6(H)的值與分數(shù)S6相加。此外,權(quán)重a7(H)的值與分數(shù)S7相加,權(quán)重 a 8 (H)的值與分數(shù)S8相加,并且權(quán)重a 9 (H)的值與分數(shù)S9相加。 接下來,使用存儲在評估值計算字典301的第二行中的各個值,重復上述計算。具 體地,提取存儲在評估值計算字典301的第二行中的、在對應于位置1 (ul, vl) 302的值的位 置443處的亮度值A(chǔ) (2)、以及對應于位置2 (u2, v2) 303的值的位置444處的亮度值B (2)。 使用下面的表達式,計算每個提取的亮度值的差值C(2)。
C(2) = A(2)-B(2) 接下來,比較存儲在評估值計算字典301的第二行中的閾值(9 )304的閾值e (2) 和每個計算的亮度值的差值C(2),并且確定計算的差值C(2)是否小于閾值e (2)。在計算 的差值C(2)小于閾值e (2)的情況下,存儲在評估值計算字典301的第二行中的權(quán)重(a 1 到a 9) 305中的L的各個值與對應的分數(shù)Sl到S9順序相加。另一方面,在計算的差值C (2) 大于閾值9 (2)的情況下,存儲在評估值計算字典301的第二行中的權(quán)重(a 1到a 9)305 中的H的各個值與對應的分數(shù)Sl到S9順序相加。接下來,順序使用評估值計算字典301 的第三行和此后直到第T行中存儲的各個值,重復上述計算。 也就是說,在使用用于確定對象圖像440的評估值計算字典301執(zhí)行評估值計算
處理的情況下,評估值計算單元235順序使用評估值計算字典301的第一行到第T行中存
儲的各個值,并使用表達式29計算C(i)。確定計算的C(i)是否滿足表達式30。變量i是
整數(shù),并指示1到T的值。 C (i) = A (i) -B (i) 表達式29 C(i) < 9 (i). .表達式30 在計算的C(i)滿足表達式30的情況下,評估值計算單元235將a 1L(i)到 a9L(i)的各個值與對應的分數(shù)S1到S9相加。另一方面,在計算的C(i)不滿足表達式30 的情況下,評估值計算單元235將a 1H(i)到a 9H(i)的各個值與對應的分數(shù)Sl到S9順 序相加。A(i)表示對應于第i行中存儲的位置l(ul, v1)302的亮度值,并且B(i)表示對 應于第i行中存儲的位置2(u2, v2)303的亮度值。此外,9 (i)表示第i行中存儲的閾值 (e)304的值。此外,alH(i)到a9H(i)表示權(quán)重(al到a 9) 305中的H的各個值,并且 a 1L(i)至IJ a 9L(i)表示權(quán)重(a 1至lj a 9)305中的L的各個值。 在結(jié)束使用評估值計算字典301的第一行到第T行中存儲的各個值的各種計算之 后的分數(shù)(評估值)Sl到S9可使用下面的表達式31表示。
T Sj - Sh(Xp Cj)...表達式31 i=l 在C(i) > 9 (i)成立的情況下,h(xi,ci)表示表達式25中計算的ajH(i),并且 在C(i) < e (i)成立的情況下,表示表達式26中計算的ajL(i)。此外,j二l到9。
圖23B示出表示經(jīng)歷評估值的計算的面部的圖像601到609、以及評估值計算單 元235關(guān)于確定對象圖像440計算的評估值Sl到S9之間的關(guān)系。如圖23B所示,在結(jié)束 使用評估值計算字典301的第T行中存儲的各種值的各種計算時,計算九個評估值S 1到 S9。注意,在圖23B中,評估值Sl到S9的大小表示為條形曲線圖的模型。
因此,將通過評估值計算單元235計算的評估值SI到S9輸出到選擇單元236。選 擇單元236提取評估值SI到S9中的等于或大于閾值447的評估值。例如,在圖23B所示 的評估值Sl到S9中,提取對應于圖像601、602、606和608的評估值Sl、 S2、 S6和S8。接 下來,選擇單元236選擇提取的評估值中三個具有最高值的評估值,并將關(guān)于對應于選擇 的評估值的對象的信息(選擇對象信息)輸出到面部確定單元237。例如,在提取的評估值 Sl、 S2、 S6和S8中,將評估值Sl、 S7和S8選擇為三個具有最高值的評估值。在圖23B中, 示出選擇的評估值S1、S7和S8的條形曲線圖示出為陰影區(qū)域。接下來,對應于評估值S1、 S7和S8的選擇對象信息輸出到面部確定單元237。 注意,在評估值S1到S9中存在等于或大于閾值447的評估值的情況下,選擇單元 236輸出此含義的信息到面部確定單元237。此外,在僅存在1個或2個等于或大于閾值447 的評估值的情況下,選擇單元236將對應于1個或2個評估值的選擇對象信息輸出到面部 確定單元237。例如,0可用作閾值447。此外,為了具有相對低的可靠度,可使用小于O的 值,或可使用另一值。 接下來,將參照附圖詳細描述使用確定對象圖像的面部確定字典執(zhí)行面部確定處 理的示例。 圖24A到24D是示出根據(jù)本發(fā)明第一實施例、從圖像提取單元233提取的確定對 象圖像、和通過面部確定單元237對確定對象圖像計算的評估值的示例的圖。圖24A示出 作為確定對象圖像的示例的確定對象圖像440。注意,確定對象圖像440與圖23A所示的確 定對象圖像440相同。此外,在該示例中,將描述作為與圖23A所示的示例類似的對確定對 象圖像440設(shè)置兩維網(wǎng)格并執(zhí)行面部確定處理的情況的示例。 首先,面部確定單元237從面部確定字典存儲單元310獲得用于確定對應于通過 選擇單元236選擇的評估值的對象的面部確定字典,并將其保持在面部確定字典存儲器 239中。例如,如圖23B所示,在通過選擇單元236選擇評估值S1、S7和S8的情況下,獲得 對應于評估值S1、S7和S8的面部確定字典311、317和318,并將其保持在面部確定字典存 儲器239中。接下來,面部確定單元237使用面部確定字典存儲器239中保持的各面部確 定字典,順序計算關(guān)于每個面部確定字典的評估值。注意,通過面部確定單元237使用面部 確定字典進行的評估值的計算與通過評估值計算單元235使用評估值計算字典進行的評 估值的計算類似,除了權(quán)重(a)的數(shù)量不同。 例如,對應于面部確定字典311的第i行中存儲的位置l(ul, v1)321的亮度值 A(i)表示為A(i),對應于位置2(u2, v2)321的亮度值B(i)表示為B (i),并且亮度值A(chǔ) (i) 和亮度值B(i)之間的差值表示為C(i)。此外,面部確定字典311的第i行中存儲的閾值 (e)的值表示為e (i),第i行中存儲的權(quán)重(a)324的H值表示為aH(i),并且第i行中 存儲的權(quán)重(a)324的L值表示為aL(i)。 例如,在使用確定對象圖像440的面部確定字典311執(zhí)行評估值計算處理的情況 下,將0設(shè)為評估值中示出的分數(shù)S的值。面部確定單元237順序使用面部確定字典311 的第l行到第Z行中存儲的各值,并使用表達式32計算C(i)。接下來,確定計算的C(i)是 否滿足表達式33。變量i是整數(shù),并且示出從1到Z的值。
<formula>formula see original document page 32</formula>表達式32
<formula>formula see original document page 32</formula>表達式33
在計算的C(i)滿足表達式33的情況下,面部確定單元237將aL(i)的值與分數(shù) S相加。另一方面,在計算的C(i)不滿足表達式33的情況下,面部確定單元237將aH(i) 的值與分數(shù)S相加。 在結(jié)束使用面部確定字典311的第1行到第Z行中存儲的各值的各種計算之后的
分數(shù)(評估值)S可通過下面的表達式34表示。 T S = 2]h(Xi).…表達式34 i=l 在C(i) > 9i成立的情況下,h(Xi)表示用表達式7計算的ciH(i),并且在C(i) < 9 i成立的情況下,h(Xi)表示用表達式8計算的aL(i)。注意,對于其他面部確定字典 312到319,可類似地計算分數(shù)(評估值)S。注意,在圖24A到25C中,使用面部確定字典 311到319計算的各評估值示出為評估值SS1到SS9。 圖24B示出表示經(jīng)歷評估計算的面部的圖像601、607和608、以及通過面部確定單 元237對確定對象圖像440計算的評估值SS1、 SS7和SS8之間的關(guān)系。如圖24B所示,在 使用面部確定字典311的第Z行中存儲的各值的各計算結(jié)束時,計算一個評估值SS1。類似 地,在使用面部確定字典317的第Z行中存儲的各值的各計算結(jié)束時,計算一個評估值SS7。 在使用面部確定字典318的第Z行中存儲的各值的各計算結(jié)束時,計算一個評估值SS8。注 意,在圖24B中,評估值SS1、 SS7和SS8的大小表示為具有條形曲線圖的模型。
因此,面部確定單元237基于計算的評估值SS1、SS7和SS8,確定面部是否包括在 確定對象圖像440中。也就是說,面部確定單元237在計算的評估值中選擇等于或大于閾 值并具有最高值的評估值,并確定對應于所選擇的評估值的面部包括在確定對象圖像440 中。例如,在圖24B所示的評估值SS1、SS7和SS8中,等于或大于閾值448的評估值是評估 值SS7和SS8。此外,在評估值SS7和SS8中,選擇具有最高值的評估值SS7。對應于評估 值SS7的圖像607中包括的面部被確定為包括在確定對象圖像440中。將確定結(jié)果輸出到 確定結(jié)果輸出單元238。 注意,在計算的評估值中不存在等于或大于閾值的評估值的情況下,面部確定單 元237確定對象面部不包括在確定對象圖像440中,并且將此含義的信息輸出到確定結(jié)果 輸出單元238。例如,0可用作閾值448。此外,為了具有相對低的可靠度,可使用小于O的
值或可使用另一值。 因此,使得確定對象圖像的分辨率為相同分辨率并且用于評估計算的特征量一致 地為兩點之間的亮度值,這使得能夠在多個面部確定字典之間切換,并且可用相同的算法 創(chuàng)建多個評估值。 圖25A到25C是示意性示出根據(jù)本發(fā)明第一實施例、在用面部檢測單元230執(zhí)行
面部檢測的情況下的流程的圖。圖25A示出通過圖像提取單元233提取的確定對象圖像
440。確定對象圖像440與圖23A到24D中示出的確定對象圖像440相同。 圖25B示出表示經(jīng)歷確定的面部的圖像601到609、和通過評估值計算單元235計
算的評估值S1到S9之間的關(guān)系。注意,圖25B所示的關(guān)系與圖23B所示的關(guān)系類似。此
外,在圖25B中,對應于通過選擇單元236選擇的評估值的區(qū)域用粗框圍繞。 圖25C示出表示經(jīng)歷確定的面部的圖像601到609、和通過面部確定單元237計算
33的評估值SS1、SS7和SS8之間的關(guān)系。注意,在圖25C中,對其通過面部確定單元237計算 評估值的區(qū)域用粗框圍繞。 圖25B所示的評估值Sl到S9是縮窄用于計算圖25C所示的評估值SS1到SS9的 對象的評估值。因此,可減小評估值計算的計算量,并且可快速執(zhí)行評估值計算處理。注 意,評估值Sl到S9的可靠度相對低,從而例如如圖25B所示,認為對應于看起來不像確定 對象圖像440中包括的面部的圖像601的評估值S1的值大。即使在此情況下,使用面部確 定字典311到319的評估值的可靠度也高,從而例如如圖25C所示,最終可確定與確定對象 圖像440中包括的面部具有高類似度的圖像607。因此,通過縮窄要基于具有相對低可靠度 的第一級別的評估值確定的對象,可減小具有高可靠度的第二級別的評估值的計算處理的 對象,從而可快速執(zhí)行面部檢測處理。此外,例如如在第一級中錯誤地計算大約1或2的評 估值的情況下,可基于具有高可靠度的第二級的評估值執(zhí)行正確確定,從而可實現(xiàn)具有高 精度的對象檢測。 現(xiàn)在,例如,使用樹形結(jié)構(gòu)來考慮這樣的檢測方法,其通過使用對每種面部方向創(chuàng) 建的多個區(qū)分器,同時根據(jù)通過樹示出的分支順序區(qū)分面部的朝向,檢測面向各方向的面 部。在該檢測方法中,在順序區(qū)分面部方向的同時檢測面部,從而例如,直到得到結(jié)論為止 的平均弱假設(shè)可能變長,并且效率變差。此外,如果在直到到達葉節(jié)點為止的確定中存在錯 誤并且采用了錯誤的節(jié)點分支,則步驟不折回,并且不執(zhí)行適當?shù)拿娌繖z測。
相反,在本發(fā)明的第一實施例中,不存在節(jié)點分支邏輯,從而可以縮短直到得到結(jié) 論為止的平均弱假設(shè),并可以改進效率。此外,在第一級計算的評估值中,無論面部面向的 方向的種類如何,都可從所有對象選擇用于面部確定的候選,從而例如,即使當不確定該面 部對應于哪個對象時,也不太可能出現(xiàn)錯誤檢測。此外,不采用樹形結(jié)構(gòu),并且在第一級的 面部檢測處理中同時執(zhí)行評估,便利了其執(zhí)行,并且可以避免錯誤分支的影響。此外,在第 一級的面部檢測處理處,可使用相同特征量同時計算關(guān)于多個對象的評估值,從而可以改 進關(guān)于評估值計算處理的效率。此外,在創(chuàng)建可同時計算關(guān)于在第一級使用的多個對象的 評估值的字典的情況下,可同時創(chuàng)建關(guān)于每個對象的字典,從而改進收斂(convergent)學 習。 此外,在評估值計算的情況下,根據(jù)小于每個字典的閾值和大于所述閾值的情況, 修改與分數(shù)相乘的權(quán)重并執(zhí)行計算。因此,即使在關(guān)于確定對象圖像中的物理量的復雜分 布的情況下,也可以從其分布執(zhí)行區(qū)分。 圖26是示出根據(jù)本發(fā)明第一實施例、已經(jīng)經(jīng)歷通過面部檢測單元230的面部檢測 處理的成像圖像400和通過面部檢測單元230進行的面部檢測處理的檢測結(jié)果的圖。成像 圖像400與圖22A中所示的成像圖像400相同,并包括三個人。此外,在成像圖像400中,在 已經(jīng)檢測到三個人的面部的情況下的檢測結(jié)果用框461到463示意性示出。作為通過面部 檢測單元230進行的面部檢測處理的檢測結(jié)果,框461到463是示出位置和大小的框?;?于這里的檢測結(jié)果,例如相機參數(shù)控制單元220可確定對檢測最佳的相機參數(shù)。此外,在成 像圖像400顯示在顯示單元170上的情況下,可以顯示框461到463以便與成像圖像400 重疊。如圖26所示,例如,還可適當?shù)貦z測傾斜的面部或躺倒的人的面部。
成像圖像的操作示例 接下來,將參照附圖描述根據(jù)本發(fā)明第一實施例的成像圖像100的操作。圖27是
34示出根據(jù)本發(fā)明第一實施例、通過成像設(shè)備100進行的成像圖像記錄處理的處理過程的流
程圖。在該示例中,將描述在成像設(shè)備ioo處于成像圖像記錄等待狀態(tài)下的情況下生成成
像圖像并執(zhí)行面部檢測處理的示例。 首先,確定成像設(shè)備100是否處于成像圖像記錄等待狀態(tài)(步驟S901)。在成像設(shè) 備100處于成像圖像記錄等待狀態(tài)的情況下(步驟S901),成像單元112生成成像圖像(步 驟S902),并且面部檢測單元230對于生成的成像圖像執(zhí)行面部檢測處理(步驟S920)。將 參照圖28詳細描述面部檢測處理。面部檢測處理可關(guān)于每個幀(frame)執(zhí)行,或可關(guān)于以 每個定義的間隔的幀執(zhí)行。另一方面,在成像設(shè)備100不處于成像圖像記錄等待狀態(tài)的情 況下(步驟S901),結(jié)束成像圖像記錄處理的操作。 接下來,相機參數(shù)控制單元220確定相機參數(shù)(步驟S903)。例如,在從面部檢測 單元230輸出面部檢測信息的情況下,相機參數(shù)控制單元220基于檢測的面部的成像圖像 上的位置和大小,確定對檢測的面部最佳的相機參數(shù)。接下來,確定是否已經(jīng)按壓快門按鈕 (步驟S904),并且在已經(jīng)按壓快門按鈕的情況下,將生成的成像圖像記錄在記錄單元150 中(步驟S905)。另一方面,在還沒有按壓快門按鈕的情況下(步驟S904),結(jié)束成像圖像 記錄處理的操作。 圖28是示出根據(jù)本發(fā)明第一實施例、在通過成像設(shè)備100進行的成像圖像記錄處 理的處理過程中的面部檢測處理過程(圖27所示的步驟S920中的處理過程)的流程圖。
首先,獲得存儲設(shè)備單元130中存儲的當前成像圖像(步驟S921)。接下來,將提 取框放置在獲得的成像圖像的左上角(步驟S922),并提取提取框內(nèi)的圖像(步驟S923)。 接下來,對從提取框內(nèi)提取的圖像(確定對象圖像)執(zhí)行確定處理(步驟S940)。注意將參 照圖29詳細描述確定處理。 接下來,確定確定對象圖像是否小于提取框(步驟S924)。在確定對象圖像不小 于提取框的情況下(步驟S924),確定提取框是否存在于確定對象圖像的右邊緣(步驟 S925)。在提取框不存在于確定對象圖像的右邊緣的情況下(步驟S925),將提取框在確定 對象圖像上向右側(cè)偏移一像素并定位(步驟S926),并且流程返回到步驟S923。另一方面, 在提取框存在于確定對象圖像的右邊緣的情況下(步驟S925),確定提取框是否存在于確 定對象圖像的下邊緣(步驟S927)。在提取框不存在于確定對象圖像的下邊緣的情況下(步 驟S927),將提取框在確定對象圖像上向下偏移一像素并定位(步驟S928),并且流程返回 到步驟S923。在提取框存在于確定對象圖像的下邊緣的情況下(步驟S927),確定對象圖像 經(jīng)歷縮小處理(步驟S929),并且提取框在縮小處理后定位在圖像的左上角(步驟S922)。
另一方面,在確定對象圖像小于提取框的情況下(步驟S924),確定面部是否包 括在確定對象圖像中(步驟S930)。在確定面部包括在確定對象圖像中的情況下(步驟 S930),將示出已經(jīng)檢測到面部的面部檢測信息輸出為確定結(jié)果(步驟S932)。現(xiàn)在,在確定 多個面部包括在確定對象圖像中的情況下,輸出關(guān)于多個面部的面部檢測信息。此外,在對 于重疊區(qū)域多次確定包括面部的情況下,例如,基于具有使用在步驟S940的確定處理中的 面部確定字典計算的最大分數(shù)(評估值)的提取框的位置和大小輸出面部檢測信息。另一 方面,在未確定面部包括在確定對象圖像中的情況下(步驟S930),將示出沒有檢測到面部 的面部未確定信息輸出為確定結(jié)果(步驟S931)。 注意,在該示例中,描述了這樣的示例,其中即使在曾經(jīng)確定面部包括在確定對象圖像中的情況下,也重復執(zhí)行確定處理,直到確定對象圖像變?yōu)樾∮谔崛】颍⑶一谠摯_ 定結(jié)果,確定是否從當前成像圖像檢測到面部。然而,可進行這樣的安排,其中在曾經(jīng)確定 面部包括在確定對象圖像中的情況下,其他確定對象圖像不經(jīng)歷確定處理,并且可以輸出 示出已經(jīng)從當前成像圖像檢測到面部的面部檢測信息。 圖29是示出根據(jù)本發(fā)明第一實施例、通過成像設(shè)備100進行的面部檢測處理的處 理過程中的確定處理過程(圖28所示的步驟S940中的處理過程)的流程圖。
首先,評估值計算單元235執(zhí)行第一評估值計算處理(步驟S950)。將參照圖30 詳細描述第一評估值計算處理。接下來,選擇單元236確定在通過評估值計算單元236計 算的多個評估值中是否存在等于或高于閾值的任何評估值(步驟S941)。在存在等于或高 于閾值的評估值的情況下(步驟S941),選擇單元236從等于或高于閾值的評估值中選擇預 定數(shù)量的具有高的值的評估值(步驟S942)。例如,在通過評估值計算單元235計算的評估 值是9的情況下,按最高值的順序選擇最多三個評估值。 接下來,面部確定單元237從面部確定字典存儲單元310獲得關(guān)于對應于選擇的 評估值的對象的面部確定字典,并且將其保持在面部確定字典存儲器239中(步驟S943)。 接下來,面部確定單元237使用面部確定字典存儲器239中保持的面部確定字典來執(zhí)行第 二評估值計算處理(步驟S970)。將參照圖31詳細描述第二評估值計算處理。
接下來,面部確定單元237確定計算的一個或多個評估值中是否存在等于或大于 閾值的任何評估值(步驟S944)。在計算的一個或多個評估值中存在等于或大于閾值的評 估值的情況下(步驟S944),面部確定單元237從等于或大于閾值的評估值中選擇具有最高 值的評估值。對應于評估值的對象被確定為包括在確定對象圖像中(步驟S945)。
注意,在不存在等于或大于通過評估值計算單元235計算的評估值的評估值的情 況下(步驟S941),或在通過面部確定單元237計算的評估值中不存在等于或大于閾值的評 估值的情況下(步驟S944),結(jié)束確定處理的操作。 圖30是示出根據(jù)本發(fā)明第一實施例、通過成像設(shè)備100進行的面部檢測處理的處 理過程中的第一評估值計算處理過程(圖29中所示的步驟S950中的處理過程)的流程圖。
首先,分數(shù)Sl到S9初始化為"0"(步驟S951),并且變量i初始化為"1"(步驟 S952)。接下來,評估值計算單元235提取對應于評估值計算字典301的第i行中存儲的位 置l(ul, vl)和位置2(u2, v2)的亮度值(步驟S953)。在該示例中,設(shè)對應于位置1 (ul, vl)的亮度值是A(i),并且對應于位置2(u2,v2)的亮度值是B(i)。接下來,評估值計算單 元235計算兩個提取的亮度值的差值(A(i)-B(i))(步驟S954)。注意,步驟S953和S954 是發(fā)明內(nèi)容中所指的比較過程的示例。 接下來,評估值計算單元235確定計算的差值(A(i)-B(i))是否小于評估值計算 字典301的第i行中存儲的閾值e (i)(步驟S955)。在計算的差值(A(i)-B(i))小于閾 值9 (i)的情況下(步驟S955),評估值計算單元235將存儲在評估值計算字典的第i行 中的alL(i)到a9L(i)與分數(shù)Sl到S9順序相加(步驟S956)。另一方面,在計算的差 值(A(i)-B(i))不小于閾值e (i)的情況下(步驟S955),評估值計算單元235將存儲在第 i行中的a 1H(i)到a 9H(i)與分數(shù)Sl到S9順序相加(步驟S957)。注意,步驟S955到 S957是發(fā)明內(nèi)容中所指的計算過程的示例。 接下來,將"1 "加到變量i (步驟S958),并且確定變量i是否大于T (步驟S959)。
36在變量i不大于T的情況下(步驟S959),流程返回到步驟S953,并且重復評估值計算處理 (步驟S953到S958)。另一方面,在變量i大于T的情況下(步驟S959),結(jié)束第一評估值 計算處理的操作。 圖31是示出根據(jù)本發(fā)明第一實施例、通過成像設(shè)備IOO進行的面部檢測處理的處 理過程中的第二評估值計算處理過程(圖29中所示的步驟S970中的處理過程)的流程圖。
首先,分數(shù)S初始化為"0"(步驟S971),并且變量i初始化為"1"(步驟S972)。 接下來,面部確定單元237從確定對象圖像提取對應于面部確定字典的第i行中存儲的位 置l(ul, vl)和位置2(u2, v2)的亮度值(步驟S973)。在此示例中,設(shè)對應于位置1 (ul, vl)的亮度值是A(i),并且對應于位置2(u2,v2)的亮度值是B(i)。接下來,面部確定單元 237計算兩個提取的亮度值的差值(A(i)-B(i))(步驟S974)。注意,步驟S973和S974是 發(fā)明內(nèi)容中所指的比較過程的示例。 接下來,面部確定單元237確定計算的差值(A(i)-B(i))是否小于面部確定字典 的第i行中存儲的閾值9 (i)(步驟S975)。在計算的差值(A(i)-B(i))小于閾值e (i) 的情況下(步驟S975),面部確定單元237將存儲在面部確定字典的第i行中的a L(i)加 到分數(shù)S(步驟S976)。另一方面,在計算的差值(A(i)-B(i))不小于閾值e (i)的情況下 (步驟S975),面部確定單元237將存儲在當前的面部確定字典的第i行中的aH(i)加到 分數(shù)S(步驟S977)。注意,步驟S975到S977是發(fā)明內(nèi)容中所指的計算過程的示例。
接下來,將"1 "加到變量i (步驟S978),并且確定變量i是否大于Z (步驟S979)。 在變量i不大于Z的情況下(步驟S979),流程返回到步驟S973,并且重復使用當前面部確 定字典的評估值計算處理(步驟S973到S978)。另一方面,在變量i大于Z的情況下(步 驟S979),面部確定單元237將其與面部確定字典中對應的對象相關(guān),并保持計算的評估值 S (步驟S980)。 接下來,面部確定單元237確定在面部確定字典存儲器239中保持的面部確定字 典中是否存在還沒有計算評估值的另一面部確定字典(步驟S981)。在存在還沒有計算評 估值的另一面部確定字典的情況下(步驟S981),流程返回到步驟S971,并且重復評估值 計算處理,直到結(jié)束了對面部確定字典存儲器239中保持的所有面部確定字典的評估值計 算。另一方面,在不存在還沒有計算評估值的另一面部確定字典的情況下(步驟S981),第 二評估值計算處理的操作結(jié)束。 此外,在該示例的情況下,描述了使用從每個面部確定字典的第1行到第Z行的各 個值來計算分數(shù)S的示例。然而,例如,所述值對應于每個面部確定字典的每個記錄,并且 存儲截止(cut-off)閾值,并且在步驟S976或S977中找到的分數(shù)S降至當前記錄的截止 閾值之下的情況下,使用當前面部確定字典的評估值計算處理可以被截止。因此,可進一步 加速面部檢測處理。 如上所述,根據(jù)本發(fā)明第一實施例,因為用兩級評估值計算處理執(zhí)行面部檢測,所
以可以以較少弱假設(shè)快速執(zhí)行檢測處理,并且可改進檢測精度。此外,在面部檢測處理的情
況下,依賴于小于每個字典中的閾值的情況和大于所述閾值的情況修改和計算與分數(shù)相乘
的權(quán)重,從而可進一步改進檢測精度。 第二實施例 成像圖像的配置示例
在本發(fā)明第一實施例的情況下,示出了使用一個評估值計算字典同時計算關(guān)于多個對象的評估值的示例。在本發(fā)明第二實施例的情況下,示出這樣的示例,其通過變換要計算一個評估值計算字典中存儲的其亮度差值的兩點的位置,計算關(guān)于可使用評估值計算字典計算的對象的對象數(shù)的四倍的對象的評估值。注意,根據(jù)本發(fā)明第二實施例的成像設(shè)備與根據(jù)本發(fā)明第一實施例的成像設(shè)備100的不同在于,提供了面部檢測單元250來替代面部檢測單元230。因此,此后,將省略與本發(fā)明第一實施例共同的部分的描述,并且將主要描述不同部分。 圖32是示出根據(jù)本發(fā)明第二實施例的面部檢測單元250的功能配置示例的框圖。面部檢測單元250是圖3所示的面部檢測單元230的修改示例,并且具有位置計算單元251、評估值計算單元252和面部確定字典存儲單元253。注意,與圖3所示的面部檢測單元230共同的部分將附上相同的參考標號,并且將省略其描述。 位置計算單元251變換評估值計算字典存儲單元300中存儲的評估值計算字典301中存儲的位置l(ul, vl)302和位置2(u2, v2) 303的值,并計算兩個新的點的位置。位置計算單元251然后將變換后的兩點的位置、與變換前的兩點的位置相關(guān)并存儲在評估值計算字典301中的閾值(e)、以及權(quán)重(a 1到a 9) 305的每個值輸出到評估值計算單元252 。例如,位置計算單元251使用確定對象圖像的中心位置作為標準,使位置1 (u 1 , v 1) 302和位置2(u2, v2)303的值經(jīng)歷仿射變換,并計算兩個新的點的位置。利用仿射變換,例如,執(zhí)行在順時針方向旋轉(zhuǎn)90度的變換、在與順時針方向相反的方向旋轉(zhuǎn)90度的變換、以及旋轉(zhuǎn)180度的變換。注意,將參照圖33A到34D詳細描述該位置計算方法。
評估值計算單元252使用評估值計算字典存儲單元300中存儲的評估值計算字典301中的各個值、以及通過位置計算單元251計算的兩點的位置和與此對應的各個值來計算對于每個對象的評估值?,F(xiàn)在,將假設(shè)其中在順時針方向的90度旋轉(zhuǎn)、在與順時針方向相反的方向的90度旋轉(zhuǎn)、以及180度旋轉(zhuǎn)的每個的情況。在此情況下,通過評估值計算單元252計算的評估值變?yōu)閮H使用評估值計算字典301計算的評估值的數(shù)量的四倍。將由此計算的每個對象的評估值輸出到選擇單元236。注意,對每個對象的評估值的計算方法類似于本發(fā)明的第一實施例,從而這里將省略描述。 面部確定字典存儲單元253對每個對象使面部確定字典相關(guān),所述面部確定字典用于確定標識的對象是否包括在從圖像提取單元233輸出的圖像中。將存儲的面部確定字典提供到面部確定字典存儲器239。現(xiàn)在,對多個對象的每個存儲面部確定字典,所述多個對象對應于通過評估值計算單元252對其計算評估值的對象。注意,將參照圖33A到33D詳細描述對其在面部確定字典存儲單元253存儲面部確定字典的對象。
圖33A到33D是示出根據(jù)本發(fā)明第二實施例、可通過位置計算單元251計算兩個新的點的位置來對其進行評估值計算的對象的示例的圖。圖33A示出對象圖像組500,其包括示出可使用圖20B所示的評估值計算字典301對其計算評估值的對象的面部圖像。對象圖像組500對應于圖20A所示的對象圖像組600。此外,圖33B到33D示出包括下述面部圖像的對象圖像組501到503,所述面部圖像示出可通過變換圖20B所示的評估值計算字典301的位置1 (ul, v1)302和位置2(u2, v2) 303的值來對其計算評估值的對象。
如本發(fā)明第一實施例所示,圖20B中示出關(guān)于使用評估值計算字典301的面向不同方向的九種面部的評估值。現(xiàn)在,例如,評估值計算字典301的位置1(ul,vl)302和位置2(u2,v2)303中存儲的兩點的位置在與順時針方向相反的方向上旋轉(zhuǎn)90度,其中以確定對象圖像的中心位置作為旋轉(zhuǎn)標準。旋轉(zhuǎn)后的兩點的位置和與兩點的位置相關(guān)并存儲在評估值計算字典301中的閾值(e )、以及權(quán)重(a 1到a 9) 305的各個值用于執(zhí)行上述評估值計算處理。因此,例如,可同時計算關(guān)于與圖33B中所示的對象圖像組501中包括的面部圖像相對應的對象的評估值。 類似地,例如,評估值計算字典301的位置1 (ul, vl) 302和位置2 (u2, v2) 303中存
儲的兩點的位置在順時針方向旋轉(zhuǎn)90度,其中以確定對象圖像的中心位置作為旋轉(zhuǎn)標準。通過使用旋轉(zhuǎn)后的兩點的位置執(zhí)行上述評估值計算處理,例如,可計算關(guān)于與圖33C中所示的對象圖像組502中包括的面部圖像相對應的對象的評估值。 類似地,例如,評估值計算字典301的位置1 (ul, vl) 302和位置2 (u2, v2) 303中存儲的兩點的位置旋轉(zhuǎn)180度,其中以確定對象圖像的中心位置作為旋轉(zhuǎn)標準。通過使用旋轉(zhuǎn)后的兩點的位置執(zhí)行上述評估值計算處理,例如,可計算關(guān)于與圖33D中所示的對象圖像組502中包括的面部圖像相對應的對象的評估值。 通過位置計算單元251執(zhí)行這些位置的變換。此外,作為對此的位置變換方法,例如,二維網(wǎng)格上的3X3矩陣(仿射矩陣)可用于使用變換兩點的位置的仿射變換。此外,關(guān)于與圖33A到33D中所示的對象圖像組500到503中包括的每個面部圖像相對應的對象的面部確定字典的每個存儲在面部確定字典存儲單元253中。也就是說,將根據(jù)本發(fā)明第一實施例的面部確定字典存儲單元310中存儲的面部確定字典的數(shù)量的四倍的面部確定字典存儲在面部確定字典存儲單元253中。 圖34A到34D是示出通過根據(jù)本發(fā)明第二實施例的位置計算單元251計算的兩個
新的點的位置和使用這兩個新的點的位置計算的評估值之間的關(guān)系示例的圖。注意,圖34A
到34D中示出的評估值Sl到S9對應于圖23B中示出的評估值Sl到S9。 圖34A示出使用變換前的兩點的位置計算的評估值的示例。注意,圖34A示出要
對其計算評估值的確定對象圖像470、以及確定對象圖像470上的兩點的位置的組合中的
一個組合(位置47 l和472)。 圖34B示出通過位置計算單元251在與順時針方向相反的方向上旋轉(zhuǎn)90度的兩點的位置和使用這兩點的位置計算的評估值的示例。例如,位置471和472通過位置計算單元251在與順時針方向相反的方向上旋轉(zhuǎn)90度,并且變換為兩點的位置473和474。用評估值計算單元252計算使用由此變換的兩點的各位置的圖34B所示的評估值。
圖34C示出通過位置計算單元251在順時針方向上旋轉(zhuǎn)90度的兩點的位置和使用這兩點的位置計算的評估值的示例。例如,圖34A所示的兩點的位置471和472通過位置計算單元251在順時針方向上旋轉(zhuǎn)90度,并且變換為兩點的位置475和476。用評估值計算單元252計算使用由此變換的兩點的各位置的圖34C所示的評估值。
圖34D示出通過位置計算單元251旋轉(zhuǎn)180度的兩點的位置和使用這兩點的位置計算的評估值的示例。例如,圖34A所示的兩點的位置471和472通過位置計算單元251旋轉(zhuǎn)180度,并且變換為兩點的位置477和478。用評估值計算單元252計算使用由此變換的兩點的各位置的圖34D所示的評估值。 因此,可變換評估值計算字典301的位置l(ul, vl)302和位置2(u2, v2)303中存儲的兩點的位置,并且變換后的兩點的位置用于計算評估值。因此,可使用一個評估值計算
39字典快速地計算更多評估值。例如,如圖34所示,可同時計算九個評估值的評估值計算字典301用于執(zhí)行三種方式的變換,從而可計算36個評估值。因此,可減小關(guān)于評估值計算字典的存儲容量。 此外,將由此計算的圖34A到34D中所示的評估值Sl到S9輸出到選擇單元236。選擇單元236類似于本發(fā)明第一實施例提取等于或大于評估值Sl到S6的閾值447的四個評估值。在提取的評估值中,選擇三個具有最高值的評估值,并且將關(guān)于與選擇的評估值對應的對象的信息(選擇對象信息)輸出到面部確定單元237。例如,等于或大于閾值447并且對應于圖34B所示的圖像611和614以及圖34D所示的對象631的評估值被選擇為具有三個最高值的評估值。在圖34A到34D中,示出選擇的評估值的條形曲線圖以陰影示出。
圖35A到35E是示意性示出用根據(jù)本發(fā)明第二實施例的面部檢測單元250執(zhí)行面部檢測的情況下的流程的圖。圖35A示出通過圖像提取單元233提取的確定對象圖像480。圖35B示出包括示出要對其計算評估值的面部的圖像的對象圖像組500到503。注意,與圖34A到34D類似,通過評估值計算單元252計算對象圖像組500到503中包括的、對應于圖像601到609、611到619、621到629、631到639的各個評估值。例如,類似于圖34A到34D計算評估值,并且選擇對應于圖35B中所示的圖像611、614和631的評估值。
圖35C示出圖像611、614和631和通過面部確定單元237對確定對象圖像480計算的評估值SSIO到SS12之間的關(guān)系,所述圖像611、614和631示出對應于通過選擇單元236選擇的評估值的面部。注意,通過面部確定單元237進行的面部確定與本發(fā)明第一實施例類似,所以這里將省略其詳細描述。例如,對應于圖35B所示的圖像611、614和631的評估值SS10、SS11和SS12中的具有最高值、并等于或大于閾值448的評估值是評估值SSIO。因此,對應于評估值SS10的圖像611中包括的面部被確定為包括在確定對象圖像480中。
圖36是示出可通過根據(jù)本發(fā)明第二實施例的面部檢測單元250檢測的面部和其檢測結(jié)果的示例的圖。圖36用框示出包括正面面部在360度的范圍內(nèi)以預定間隔旋轉(zhuǎn)的圖像、以及用這些圖像檢測的檢測結(jié)果。如圖36所示,根據(jù)本發(fā)明第二實施例,即使對于各個角度的面部也可進行檢測??蓹z測各個角度的面部,例如,如躺在地上的人的面部、倒立的人的面部、以及在使成像設(shè)備IOO傾斜時拍攝的面部。此外,在圖36中,僅示出其中正面面部的方向在旋轉(zhuǎn)方向上傾斜的示例,但是類似地,可對在搖動或偏轉(zhuǎn)方向上傾斜的面部進行檢測。 因此,通過僅變換相同字典上的兩點的位置,可使用相同字典快速計算關(guān)于作為字典的對象的數(shù)量的若干倍的評估值。因此,可非常有效地計算評估值,并且可改進對象的檢測精度。 注意,在認為不太可能在上下翻轉(zhuǎn)的狀態(tài)下用成像設(shè)備100拍攝的情況下,可省
略通過位置計算單元251進行的180度旋轉(zhuǎn)。此外,僅將對應于可使用評估值計算字典301
對其計算評估值的對象的面部確定字典存儲在面部確定字典存儲單元253中。與上述評估
值計算處理類似,面部確定單元237可使用面部確定字典中的值或其中變換兩點的位置的
值來計算各種評估值。 成像設(shè)備的操作示例 圖37是示出通過根據(jù)本發(fā)明第二實施例的成像設(shè)備100進行的面部檢測處理的處理過程的流程圖。注意,該示例是根據(jù)本發(fā)明第一實施例的面部檢測處理(圖29中的步驟S940中的處理過程)的修改示例。因此,與圖29中所示的處理過程相同的部分將對其 附上相同參考標號,并且將省略其描述。 首先,評估值計算單元252執(zhí)行第一評估值計算處理(步驟S950)。接下來,確定 是否存在對其還沒有計算評估值的角度(步驟S991)。例如,在對順時針方向的90度、與順 時針方向相反的方向上的90度和180度的每個角度計算評估值的情況下,確定是否對這些 角度的每個計算評估值。在存在對其還沒有對其計算評估值的角度的情況下(步驟S991), 位置計算單元251變換評估值計算字典301的位置1 (ul, vl) 302和位置2 (u2, v2) 303中存 儲的兩點的位置(步驟S992)。接下來,將變換后的兩點的位置、以及與變換前的兩點的位 置相關(guān)并存儲在評估值計算字典301中的閾值(e)的各個值、以及權(quán)重(al到a9)305 輸出到評估值計算單元252,并且執(zhí)行第一評估值計算處理(步驟S950)。
注意,根據(jù)本發(fā)明實施例,示出了使用確定對象圖像上的兩點的亮度值之間的差 值來檢測對象的示例,但是本發(fā)明實施例可應用到通過使用確定對象圖像上的兩個區(qū)域的 另一物理量的差值來檢測對象的檢測方法。例如,確定對象圖像內(nèi)的兩個區(qū)域的矩形特征 可用于計算評估值并應用用于檢測對象的對象檢測方法的本發(fā)明實施例。此外,確定對象 圖像內(nèi)的兩個區(qū)域中的亮度的直方圖(頻率分布)的預定級的差值用于計算評估值,并且 本發(fā)明實施例可應用到用于檢測對象的對象檢測方法。例如,可使用作為一種亮度直方圖 的HOG :面向梯度的直方圖(Histograms ofOriented Gradients)。面向梯度的歷史將圖像 劃分為多個區(qū)域,對每個區(qū)域計算亮度的梯度方向和梯度強度,并基于這些亮度的梯度強 度和梯度方向而創(chuàng)建面向梯度的歷史。 此外,利用本實施例,已經(jīng)描述了面向各種方向的面部的示例作為用作對象檢測 處理的對象的多個對象,但是面部以外的物理對象可應用到本發(fā)明實施例。例如,如比如哺 乳動物、昆蟲、魚等的動物(例如,寵物)、汽車、飛機等的一個或多個對象的情況可應用到 本發(fā)明實施例。在此情況下,修改關(guān)于相同物理對象的種類(例如,面向各方向的狗),并且 多個對象(例如,狗和貓)的混合物可以是多個對象。 此外,本發(fā)明實施例可應用到具有成像功能的各種蜂窩電話或數(shù)字攝像機(例 如,集成相機記錄器)的成像設(shè)備,以成像靜態(tài)畫面和動態(tài)畫面。此外,例如,可與監(jiān)視相機 連接,并且本發(fā)明實施例可應用到如用于檢測人的面部的面部檢測設(shè)備的對象檢測設(shè)備。
注意,本發(fā)明實施例圖示了實現(xiàn)本發(fā)明的示例,并且與所要求保護的每個元件具 有關(guān)聯(lián)。然而,本發(fā)明不限于所述實施例,并且可在本發(fā)明的范圍和精神內(nèi)進行各種修改。
此外,用本發(fā)明實施例描述的處理過程可構(gòu)思為具有用于這里的一系列過程的過 程的方法,并且該系列過程可構(gòu)思為用于記錄程序并使得計算機執(zhí)行該系列過程的記錄介 質(zhì)。例如,可使用CD(致密盤)、MD(迷你盤)、DVD(數(shù)字多功能盤)、存儲卡、藍光盤(注冊 商標)等作為記錄介質(zhì)。 本申請包含涉及于2009年1月9日向日本專利局提交的日本優(yōu)先權(quán)專利申請JP 2009-003870中公開的主題的主題,在此通過引用并入其全部內(nèi)容。 本領(lǐng)域技術(shù)人員應當理解,依賴于設(shè)計需求和其他因素可以出現(xiàn)各種修改、組合、 子組合和更改,只要它們在權(quán)利要求或其等效物的范圍內(nèi)。
權(quán)利要求
一種對象檢測設(shè)備,包括比較單元,用于提取確定對象圖像上的兩個區(qū)域的特征量,并將基于提取的兩個特征量的特征與閾值進行比較;以及計算單元,用于根據(jù)所述比較結(jié)果選擇具有不同絕對值的兩個值之一,并且通過用選擇的值執(zhí)行計算,來計算用于確定對象是否包括在所述確定對象圖像中的評估值。
2. 如權(quán)利要求l所述的對象檢測設(shè)備,還包括確定信息存儲單元,用于存儲包括所述確定對象圖像上的兩個位置、所述閾值和所述 兩個值的多個組合的確定信息,其中所述比較單元對每個所述組合,比較由所述兩個位置 標識的所述確定對象圖像上的對兩個區(qū)域的兩個提取的特征量與所述閾值;并且其中對于每個所述組合,所述計算單元根據(jù)所述比較結(jié)果選擇所述兩個值之一, 并且通過順序執(zhí)行所選擇的值的計算來計算所述評估值。
3. 如權(quán)利要求1所述的對象檢測設(shè)備,其中對于每個所述對象,所述計算單元計算所 述評估值,以便對于每個所述對象根據(jù)所述比較結(jié)果選擇與多個對象的每個相關(guān)的所述兩 個值之一,并且對每個所述對象執(zhí)行對每個對象選擇的值的計算,從而確定所述多個對象 之一是否包括在所述確定對象圖像中。
4. 如權(quán)利要求3所述的對象檢測設(shè)備,還包括確定信息存儲單元,用于存儲包括所述確定對象圖像上的兩個位置、所述閾值和與所 述多個對象的每個相關(guān)的所述兩個值的多個組合的確定信息;其中對于每個所述組合,所述比較單元比較通過所述兩個位置標識的所述確定對象圖 像上的對兩個區(qū)域的兩個提取的特征量與所述閾值;并且其中所述計算單元計算每個所述對象的所述多個組合的、對每個所述對象選擇的 值,從而計算每個所述對象的所述評估值。
5. 如權(quán)利要求1所述的對象檢測設(shè)備,其中所述特征量是所述確定對象圖像上的兩點 的位置處的亮度值,并且其中所述比較單元計算所述兩個提取的亮度值之間的差值,并且 比較所述差值和所述閾值。
6. —種學習設(shè)備,包括加權(quán)單元,用于對包括對象和非對象之一的多個學習對象圖像加權(quán); 差值計算單元,用于對每個所述學習對象圖像,提取所述學習對象圖像上的兩個區(qū)域的特征量,并且對所述學習對象圖像上的兩個區(qū)域的每個組合計算所述兩個提取的特征量的差值;分布信息創(chuàng)建單元,用于對包括所述對象的每個學習對象圖像和包括所述非對象的每 個學習對象圖像的每個所述組合創(chuàng)建分布信息,所述分布信息示出對所述學習對象圖像加 權(quán)的權(quán)重相對于所述計算的差值的分布狀態(tài);確定單元,用于基于作為對包括所述對象的學習對象圖像創(chuàng)建的分布信息的對象分布 信息、和作為對包括所述非對象的學習對象圖像創(chuàng)建的分布信息的非對象分布信息,確定 在計算用于確定是否包括所述對象的評估值的情況下使用的所述每個組合中的一個組合、 以及與關(guān)于所述組合的所述差值相對應的閾值;以及加權(quán)計算單元,用于基于與高于和低于所確定的閾值的兩個范圍中的較低范圍中包 括的所確定的組合有關(guān)的所述對象分布信息和所述非對象分布信息、和與在所述兩個范圍中的較高范圍中包括的所確定的組合有關(guān)的所述對象分布信息和所述非對象分布信息,計 算在計算所述評估值的情況下使用的值,作為其中根據(jù)所述兩個范圍而絕對值不同的兩個值。
7. 如權(quán)利要求6所述的學習設(shè)備,其中所述確定單元基于高于和低于標準值的兩個范 圍中的較低范圍中包括的所述對象分布信息和所述非對象分布信息、和高于和低于所述標 準值的兩個范圍中的較高范圍中包括的所述對象分布信息和所述非對象分布信息,確定所 述組合和所述閾值,其中對應于所述差值的級別的一個值是標準值。
8. 如權(quán)利要求6所述的學習設(shè)備,其中所述加權(quán)單元依賴于所述學習對象圖像與所述 兩個范圍中的較低范圍相聯(lián)系還是與較高范圍相聯(lián)系,對每個所述學習對象圖像選擇所計 算的兩個值之一,并且使用對每個學習對象圖像選擇的值來計算和更新每個所述學習對象 圖像的權(quán)重。
9. 如權(quán)利要求6所述的學習設(shè)備,其中 所述對象由相互不同的第一對象和第二對象組成;并且其中所述分布信息創(chuàng)建單元對包括所述第一對象的學習對象圖像和包括所述第 二對象的學習對象圖像以及包括所述非對象的學習對象圖像的每個組合,創(chuàng)建所述分布信 息;并且其中所述確定單元基于作為對包括所述第一對象的學習對象圖像創(chuàng)建的分布信 息的第一對象分布信息、作為對包括所述第二對象的學習對象圖像創(chuàng)建的分布信息的第二 對象分布信息、以及所述非對象分布信息,確定在計算用于確定是否包括所述第一對象和 所述第二對象之一的評估值的情況下使用的所述每個組合中的所述組合之一、和關(guān)于所述 組合的所述閾值;并且其中所述加權(quán)計算單元基于與高于和低于所確定的閾值的兩個范圍中的較低范 圍中包括的所確定的組合有關(guān)的所述第一對象分布信息和所述第二對象分布信息以及所 述非對象分布信息的各種信息、以及與所述兩個范圍中的較高范圍中包括的所確定的組合 有關(guān)的所述第一對象分布信息和所述第二對象分布信息以及所述非對象分布信息的各種 信息,計算所述第一對象和所述第二對象的每個的值,用作其中絕對值依賴于所述兩個范 圍而不同的兩個值。
10. —種對象檢測方法,包括以下步驟提取確定對象圖像上的兩個區(qū)域的特征量,并比較兩個提取的特征量和閾值;以及 選擇具有不同絕對值的兩個值之一,并且對根據(jù)所述比較結(jié)果而選擇的選擇值執(zhí)行計 算,從而計算用于確定對象是否包括在所述確定對象圖像中的評估值。
11. 一種使得計算機執(zhí)行以下步驟的程序提取確定對象圖像上的兩個區(qū)域的特征量,并比較兩個提取的特征量和閾值;以及 選擇具有不同絕對值的兩個值之一,并且對根據(jù)所述比較結(jié)果而選擇的選擇值執(zhí)行計 算,從而計算用于確定對象是否包括在所述確定對象圖像中的評估值。
全文摘要
提供了一種對象檢測設(shè)備、學習設(shè)備、對象檢測方法和程序。所述對象檢測設(shè)備包括比較單元,用于提取確定對象圖像上的兩個區(qū)域的特征量,并比較基于提取的兩個特征量的特征量和閾值;以及計算單元,用于根據(jù)所述比較結(jié)果選擇具有不同絕對值的兩個值之一,并且通過用選擇的值執(zhí)行計算,計算用于確定對象是否包括在所述確定對象圖像中的評估值。
文檔編號G06K9/00GK101794392SQ201010003219
公開日2010年8月4日 申請日期2010年1月11日 優(yōu)先權(quán)日2009年1月9日
發(fā)明者小川要 申請人:索尼公司