專利名稱:學習裝置、學習方法、識別裝置、識別方法和程序的制作方法
技術領域:
本發(fā)明涉及一種學習裝置、學習方法、識別裝置、識別方法和程序,更具體地講,涉 及適于在識別存在于圖像上的被攝體是否是預定的待識別對象的情況下采用的學習裝置、 學習方法、識別裝置、識別方法和程序。
背景技術:
作為用于從相機獲得的圖像識別(認出)該圖像上存在的用作待識別對象的對象 的根據現有技術的識別方法,存在一種采用在某種廣泛的意義上描述待識別對象的模板執(zhí) 行匹配的識別方法。利用這個識別方法,預先準備在某種廣泛的意義上描述待識別對象的模板,具體 地講,預先準備整個待識別對象的紋理的模板,并且在待識別圖像的模板與待識別圖像 (待處理圖像)之間執(zhí)行匹配。然而,通過采用描述待識別對象的模板進行匹配,很難處理存在于待處理圖像上 的待識別對象的局部隱藏或畸變。因此,提出了一種識別方法,其中,關注待處理圖像的局部區(qū)域,從每個局部區(qū)域 提取特征量,并且采用每個局部區(qū)域的特征量的組合(局部區(qū)域的特征量的集合,即例如 以每個局部區(qū)域的特征量作為要素的矢量)執(zhí)行識別。根據采用局部區(qū)域的特征量集合的識別方法,在一定程度上消除了通過采用在某 種廣泛的意義上描述待識別對象的模板的識別方法很難進行處理的問題(例如待識別對 象的局部隱藏或畸變),由此能夠執(zhí)行高精度識別。除了單個對象的識別以外,局部區(qū)域的特征量還用于識別對象的類別。例如,已 經提出了一種使用局部區(qū)域的特征量識別特定類別(例如人臉)的識別方法(例如,見 P. Viola, Μ. Jones, Robust Real-time Face Detection,cvpr2001)。另外,對于識別類別,已經提出了各種識別方法。針對類別的識別提出的識別方法 的例子包括采用BoF(特征包,Bag of Features)柱狀圖的識別方法(例如,參見G. Csurka, C. Bray, C. Dance,and L. Fan. Visual categorization with bags of keypoint,ECCV2004) 和采用特征量的相關的識別方法(例如,參見日本未審專利申請公布No. 2007-128195)。例如,通過采用BoF柱狀圖的識別方法,采用稱作視覺碼本(Visual codebook)的 代表性特征量,從而抑制圖像表達的維度。然而,在采用這種視覺碼本的情況下,圖像區(qū)域中特征量的出現位置的信息丟失, 因此識別精度出現下降。因此,為了處理這個問題,提出了一種通過以網格形狀(柵格)劃分圖像區(qū)域提供 弱位置約束的方法(例如,見 S. Lazebnik,C. Schmid, J. Ponce "Beyond Bag of Features Spatial Pyramid Matching for Recognizing Natural Scene Categories,,,CVPR2006)。
發(fā)明內容
然而,即使使用以上的視覺碼本抑制圖像表達的維度,在將它應用到識別多個類 別(多個類)的情況下,必須建立特征量池,該特征量池即為用于根據類別識別類別的多個 特征量的集合,并且在類別的數目增加的情況下,與每個類別對應的特征量變得非常大。因此,在使用視覺碼本執(zhí)行類別識別的情況下,例如,用于存儲視覺碼本的存儲器 的容量增加。另外,根據通過以網格形狀劃分圖像區(qū)域提供弱位置約束的方法,位置約束對每 個類別是共同的,從而識別待識別對象的精度下降。在這種情況下,為了抑制識別精度的下降,必須通過產生用于提高識別精度的每 個類別中固有的視覺碼本提高識別精度,從而特征量變得很大,并且由此,存儲視覺碼本的 存儲器的容量同樣增加。已經發(fā)現希望共享用于識別單個對象的特征量或在待識別對象之間的待識別對 象的類別,從而高精度檢測待識別對象并且抑制特征量的增加。根據本發(fā)明的第一實施例的學習裝置是如下學習裝置,包括特征點提取單元,被 構造為從多個產生用圖像的每一個提取特征點,其中所述多個產生用圖像用于產生識別存 在于圖像上的被攝體是否是預定的待識別對象的識別器,并且所述多個產生用圖像由存在 所述待識別對象的正像和不存在所述待識別對象的負像組成;特征點特征量提取單元,被 構造為從所述產生用圖像提取表示所述特征點的特征的特征點特征量;整體特征量計算單 元,被構造為基于共享碼本,從所述產生用圖像的所述特征點特征量計算表示所述產生用 圖像的整體特征的整體特征量,所述共享碼本包括共同用于產生識別不同待識別對象的每 一個的識別器的產生用特征量;以及識別器產生單元,被構造為基于所述產生用圖像的所 述整體特征量和表示所述產生用圖像是正像還是負像的正確答案標簽產生所述識別器?;诟鶕谝粚嵤├膶W習裝置,還可以設置有共享碼本存儲單元,被構造為存 儲共享碼本,所述共享碼本包括碼本,按照與用于標識所述產生用特征量的標識符相關 的方式保持多個所述產生用特征量的每一個,以及共享信息,是針對用于識別不同的待識 別對象的每一個的每個識別器建立的多個共享信息,并且還包括所述多個產生用特征量中 的、在計算所述整體特征量時使用的所述產生用特征量的標識符;所述整體特征量計算單 元使用保持在所述碼本中的所述多個產生用特征量中的、與包括在針對由所述識別器產生 單元產生的所述識別器創(chuàng)建的所述共享信息中的標識符相關的產生用特征量計算所述整 體特征量?;诟鶕谝粚嵤├膶W習裝置,所述多個共享信息中的預定的共享信息具有與 包括在其它共享信息中的標識符相同的標識符。基于根據第一實施例的學習裝置,所述預定的共享信息具有還與從作為正像的模 型圖像提取的特征點相關的所述標識符;所述整體特征量計算部件使用與所述標識符相關 的產生用特征量和存在于所述產生用圖像上的整體范圍中的、基于與所述標識符相關的所 述特征點確定的范圍上的特征點的特征點特征量計算所述整體特征量?;诟鶕谝粚嵤├膶W習裝置,包括在所述預定的共享信息中的所述標識符與 不同于下列特征點的特征點相關,所述特征點相關于與包括在所述其它共享信息中的標識 符相同的標識符。
基于根據第一實施例的學習裝置,還設置有模型圖像特征點提取單元,被構造為 從作為正像的模型圖像提取特征點;以及量化單元,被構造為基于所述模型圖像的特征點 中的頻率分布對所述特征點進行量化;其中,所述共享信息具有與量化后的所述特征點相 關的所述標識符。基于根據第一實施例的學習裝置,其中,所述整體特征量計算單元計算表示包括 在所述共享碼本中的所述產生用特征量與所述產生用圖像的所述特征點特征量之間的相 關的相關值作為所述整體特征量。基于根據第一實施例的學習裝置,其中,所述識別器產生單元產生所述識別器和 表示減小所述誤差值的所述維度特征量的維度的維度信息,所述識別器用于使用在多個維 度特征量中的、減小表示所述正像和所述負像的識別錯誤的程度的誤差值的所述維度特征 量來執(zhí)行識別,所述多個維度特征量是由多個維度矢量表示的所述整體特征量的每個維度要素。根據本發(fā)明第一實施例的學習方法是一種學習用于識別預定的待識別對象的識 別器的學習裝置的學習方法,所述學習裝置包括特征點提取單元,特征點特征量提取單 元,整體特征量計算單元,以及識別器產生單元,所述學習方法包括如下步驟通過所述特 征點提取單元,從多個產生用圖像的每個提取特征點,所述產生用圖像用于產生識別存在 于圖像上的被攝體是否是預定的待識別對象的識別器,并且所述產生用圖像由存在所述待 識別對象的正像和不存在所述待識別對象的負像組成;通過所述特征點特征量提取單元, 從所述產生用圖像提取表示所述特征點的特征的特征點特征量;通過所述整體特征量計算 單元,基于共享碼本從所述產生用圖像的所述特征點特征量計算表示所述產生用圖像的整 體特征的整體特征量,所述共享碼本包括共同用于產生識別不同的待識別對象的每一個的 識別器的產生用特征量;以及通過所述識別器產生單元,基于所述產生用圖像的所述整體 特征量和表示所述產生用圖像是正像還是負像的正確答案標簽產生所述識別器。根據本發(fā)明第一實施例的第一程序是一種使得計算機充當以下單元的程序特征 點提取單元,被構造為從多個產生用圖像的每一個提取特征點,所述產生用圖像用于產生 識別存在于圖像上的被攝體是否是預定的待識別對象的識別器,并且所述產生用圖像由存 在所述待識別對象的正像和不存在所述待識別對象的負像組成;特征點特征量提取單元, 被構造為從所述產生用圖像提取表示所述特征點的特征的特征點特征量;整體特征量計算 單元,被構造為基于共享碼本從所述產生用圖像的所述特征點特征量計算表示所述產生用 圖像的整體特征的整體特征量,所述共享碼本包括共同用于產生識別不同的待識別對象的 每一個的識別器的產生用特征量;以及識別器產生單元,被構造為基于所述產生用圖像的 所述整體特征量和表示所述產生用圖像是正像還是負像的正確答案標簽產生所述識別器。根據本發(fā)明的第一實施例,從多個產生用圖像(用于產生識別存在于圖像上的被 攝體是否是預定的待識別對象的識別器并且由存在待識別的對象的正像和不存在待識別 的對象的負像組成)的每一個提取特征點,從產生用圖像提取表示特征點的特征的特征點 特征量,基于共享碼本(包括共同用于產生識別不同的待識別對象的每一個的識別器的產 生用特征量)從產生用圖像的特征點特征量計算表示產生用圖像的整體特征的整體特征 量,以及基于產生用圖像的整體特征量和表示產生用圖像是正像還是負像的正確答案標簽 產生識別器。
根據本發(fā)明第二實施例的識別裝置,包括特征點提取單元,被構造為從待處理圖 像提取特征點,所述待處理圖像用作用于識別存在于圖像上的被攝體是否是預定的待識別 對象的處理對象;特征點特征量提取單元,被構造為從所述待處理圖像提取表示所述特征 點的特征的特征點特征量;整體特征量計算單元,被構造為基于共享碼本從所述待處理圖 像的特征點特征量計算表示所述待處理圖像的整體特征的整體特征量,所述共享碼本包括 共同用于產生用于識別不同的待識別對象的每一個的識別器的產生用特征量;以及識別單 元,被構造為基于用于識別存在于圖像上的被攝體是否是預定的待識別對象的識別器和所 述整體特征量識別存在于所述待處理圖像上的被攝體是否是預定的待識別對象?;诟鶕诙嵤├淖R別裝置,還設置有共享碼本存儲單元,被構造為存儲共 享碼本,所述共享碼本包括碼本,按照與用于標識所述產生用特征量的標識符相關的方式 保持多個所述產生用特征量的每一個,以及共享信息,是針對用于識別不同的待識別對象 的每一個的每個識別器建立的多個共享信息,并且還包括所述多個產生用特征量中的、在 計算所述整體特征量時使用的所述產生用特征量的所述標識符;其中,所述整體特征量計 算單元使用保持在所述碼本中的所述多個產生用特征量中的、與包括在針對由所述標識部 件使用的所述識別器創(chuàng)建的所述共享信息中的所述標識符相關的產生用特征量計算所述 整體特征量?;诟鶕诙嵤├淖R別裝置,其中,所述多個共享信息中的預定的共享信息 具有與包括在其它共享信息中的所述標識符相同的標識符?;诟鶕诙嵤├淖R別裝置,其中,所述預定的共享信息具有還與從存在所 述預定的待識別對象的模型圖像提取的特征點相關的所述標識符;并且其中,所述整體特 征量計算部件使用與所述標識符相關的產生用特征量和存在于所述待處理圖像上的整體 范圍中的、基于與所述標識符相關的所述特征點確定的范圍上的特征點的特征點特征量計 算所述整體特征量?;诟鶕诙嵤├淖R別裝置,其中,包括在所述共享信息中的所述標識符與 不同于下列特征點的特征點相關,所述特征點相關于與包括在所述其它共享信息中的所述 標識符相同的標識符?;诟鶕诙嵤├淖R別裝置,其中,所述整體特征量計算單元計算表示包括 在所述共享碼本中的所述產生用特征量與所述待處理圖像的所述特征點特征量之間的相 關的相關值作為所述整體特征量?;诟鶕诙嵤├淖R別裝置,其中,所述整體特征量計算單元基于所述共享 碼本,從所述待處理圖像的特征點特征量計算表示所述待處理圖像的整體特征的、由多個 維度特征量組成的整體特征量;并且其中,所述識別單元通過將組成所述整體特征量的所 述多個維度特征量中的預定維度特征量提供給識別存在于圖像上的被攝體是否是預定的 待識別對象的識別器作為輸入,識別存在于所述待處理圖像上的被攝體是否是預定的待識 別對象。基于根據第二實施例的識別裝置,其中,所述識別單元通過將組成所述整體特征 量的所述多個維度特征量中的、維度信息所表示的維度的維度特征量提供給用于識別存在 于圖像上的被攝體是否是預定的待識別對象的識別器作為輸入,從而識別在所述圖像上出 現的被攝體是否是預定的待識別對象;并且其中,所述識別器使用表示所述整體特征量的所述多個維度特征量中的、減小誤差值的所述維度特征量執(zhí)行識別,所述誤差值表示對于 是所述待識別對象存在于圖像上的正像還是所述待識別對象不存在于圖像上的負像的識 別錯誤的程度;并且其中,所述維度信息表示減小所述誤差值的所述維度特征量的維度。根據本發(fā)明第二實施例的識別方法是一種識別在圖像上出現的被攝體是否是預 定的待識別對象的識別裝置的識別方法,所述識別裝置包括特征點提取單元,特征點特征 量提取單元,整體特征量計算單元,以及識別單元,所述識別方法包括如下步驟通過所述 特征點提取單元,從作為用于識別存在于圖像上的被攝體是否是預定的待識別對象的處理 對象的待處理圖像提取特征點;通過所述特征點特征量提取單元,從所述待處理圖像提取 表示所述特征點的特征的特征點特征量;通過所述整體特征量計算單元,基于共享碼本從 所述待處理圖像的特征點特征量計算表示所述待處理圖像的整體特征的整體特征量,所述 共享碼本包括共同用于產生用于識別不同的待識別對象的每一個的識別器的產生用特征 量;以及通過所述識別單元,基于用于識別存在于圖像上的被攝體是否是預定的待識別對 象的識別器和所述整體特征量來識別存在于所述待處理圖像上的被攝體是否是預定的待 識別對象。根據本發(fā)明第二實施例的第二程序是一種使得計算機充當以下單元的程序特征 點提取單元,被構造為從待處理圖像提取特征點,所述待處理圖像作為用于識別存在于圖 像上的被攝體是否是預定的待識別對象的處理對象;特征點特征量提取單元,被構造為從 所述待處理圖像提取表示所述特征點的特征的特征點特征量;整體特征量計算單元,被構 造為基于共享碼本從所述待處理圖像的特征點特征量計算表示所述待處理圖像的整體特 征的整體特征量,所述共享碼本包括共同用于產生用于識別不同的待識別對象的每一個的 識別器的產生用特征量;以及識別單元,被構造為基于用于識別存在于圖像上的被攝體是 否是預定的待識別對象的識別器和所述整體特征量識別存在于所述待處理圖像上的被攝 體是否是預定的待識別對象。根據本發(fā)明的第二實施例,從待處理圖像提取特征點,所述待處理圖像作為用于 識別存在于圖像上的被攝體是否是預定的待識別對象的處理對象;從所述待處理圖像提取 表示所述特征點的特征的特征點特征量;基于共享碼本從所述待處理圖像的特征點特征量 計算表示所述待處理圖像的整體特征的整體特征量,所述共享碼本包括共同用于產生用于 識別不同的待識別對象的每一個的識別器的產生用特征量;以及基于用于識別存在于圖像 上的被攝體是否是預定的待識別對象的識別器和所述整體特征量,識別存在于所述待處理 圖像上的被攝體是否是預定的待識別對象。根據本發(fā)明,在識別存在于圖像上的被攝體是否是預定的待識別對象的情況下, 能夠以更加準確的方式檢測待識別對象并且抑制用于識別的特征量的增加。
圖1是示出應用本發(fā)明的實施例的學習裝置的第一結構例子的框圖;圖2是示出共享碼本產生單元的結構例子的框圖;圖3是用于描述由特征量置換單元和量化單元執(zhí)行的處理的例子的圖;圖4是示出了共享碼本的例子的圖;圖5A到5C是描述由量化單元執(zhí)行的處理的例子的圖6是描述由圖1中的整體特征量計算單元執(zhí)行的處理的例子的圖;圖7是描述識別器產生方法的例子的圖;圖8是描述由圖1中的學習裝置執(zhí)行的學習處理的流程圖;圖9是描述共享碼本產生處理的流程圖;圖10是描述碼本產生處理的流程圖;圖11是描述識別器產生處理的流程圖;圖12是示出使用通過圖1中的學習裝置的學習產生的識別器識別待識別對象的 第一識別裝置的結構例子的框圖;圖13是描述由圖12中的識別裝置執(zhí)行的識別處理的流程圖;圖14是示出應用本發(fā)明的實施例的學習裝置的第二結構例子的框圖;圖15是描述由范圍確定單元執(zhí)行的處理的例子的圖;圖16是描述由圖14中的整體特征量計算單元執(zhí)行的處理的例子的圖;圖17是描述由圖14中的學習裝置執(zhí)行的學習處理的流程圖;圖18是描述范圍確定處理的流程圖;圖19是示出使用由圖14中的學習裝置的學習產生的識別器識別待識別對象的第 二識別裝置的結構例子的框圖;圖20是描述通過圖19中的識別器執(zhí)行的識別處理的流程圖;以及圖21是示出計算機的結構例子的框圖。
具體實施例方式將在下文中描述用于執(zhí)行本發(fā)明的實施方式(下文稱作實施例)。注意將按照下面順序進行描述。1.第一實施例(不同的待識別對象共同使用特征點特征量的例子)2.第二實施例(針對每個待識別對象使用不同范圍的例子)3.變型第一實施例學習裝置1的結構例子圖1示出了應用本發(fā)明的第一實施例的學習裝置1的結構例子。這個學習裝置1使用學習用圖像產生用于識別存在于圖像上的被攝體是否是預 定的待識別對象的識別器(函數),和產生后述的維度信息。這里,學習用圖像是用于產生(學習)識別器的圖像,包括多個模型圖像、多個原 始圖像和多個產生用圖像。模型圖像是存在可作為待識別對象(例如,筆記型個人計算機(筆記本計算機)、 汽車、等等)的被攝體的圖像。另外,原始圖像是包括不依賴于特定的待識別對象的多個特 征量的圖像,即與特定的待識別對象的特征量無關地、用于提取各種類型的特征量的圖像。關于原始圖像的例子,采用存在人工對象或例如風景的自然對象的圖像。另外,產生用圖像既包括正像又包括負像,在正像上存在待識別對象(例如,筆記 本計算機),在負像上不存在待識別對象。另外,對產生用圖像添加有正確答案標簽。這個正確答案標簽存在于每個產生用圖像,表示每個產生用圖像是正像還是負像。具體地講,這個學習裝置1產生共享碼本,其中,從多個原始圖像提取的特征量被 共享作為能夠作為待識別對象的被攝體(例如,筆記本計算機、汽車、等等)的特征量。接下來,學習裝置1使用產生的共享碼本產生用于識別存在于圖像上的被攝體是 否是預定的待識別對象(例如,汽車)的識別器和對應的維度信息。學習裝置1被構造為包括輸入單元21、共享碼本產生單元22、共享碼本存儲單元 23、特征點提取單元M、特征量提取單元25、整體特征量計算單元沈和識別器產生單元27。多個模型圖像、多個原始圖像和多個產生用圖像被提供給輸入單元21作為學習 用圖像。輸入單元21將提供的多個模型圖像和多個原始圖像輸入(提供)給共享碼本產 生單元22。另外,輸入單元21將提供的多個產生用圖像輸入到特征點提取單元24。共享碼本產生單元22基于來自輸入單元21的多個模型圖像和多個原始圖像產生 共享碼本(在該共享碼本中共享能夠作為待識別對象的被攝體的特征量),并且將它提供 并存儲到共享碼本存儲單元23。注意將在以后參照圖2描述共享碼本產生單元22的細節(jié)。共享碼本存儲單元23存儲來自共享碼本產生單元22的共享碼本。特征點提取單元M從輸入單元21順序選擇多個產生用圖像的每一個作為關注的 產生用圖像,并且從關注的產生用圖像提取特征點。接下來,特征點提取單元M將提取的 特征點和關注的產生用圖像一起提供給特征量提取單元25。這里,由于圖像的局部信息通常包括在角點(corner point)中,所以特征點提取 單元M提取角點(用作角點的像素)作為特征點??梢允褂霉锼菇翘綔y器執(zhí)行角點的提取。通過哈里斯角探測器,如果我們假設 某位置(χ,y)的像素的像素值(例如,亮度)表示為I (χ,y),則通過下面表達式(1)獲得 的亮度梯度的二階矩L的兩個本征值等于或大于預定閾值的像素被檢測為角點。
權利要求
1.一種學習裝置,包括特征點提取部件,被構造為從多個產生用圖像的每一個提取特征點,其中所述多個產 生用圖像用于產生識別存在于圖像上的被攝體是否是預定的待識別對象的識別器,并且所 述多個產生用圖像由存在所述待識別對象的正像和不存在所述待識別對象的負像組成;特征點特征量提取部件,被構造為從所述產生用圖像提取表示所述特征點的特征的特 征點特征量;整體特征量計算部件,被構造為基于共享碼本,從所述產生用圖像的所述特征點特征 量計算表示所述產生用圖像的整體特征的整體特征量,所述共享碼本包括共同用于產生識 別不同待識別對象的每一個的識別器的產生用特征量;以及識別器產生部件,被構造為基于所述產生用圖像的所述整體特征量和表示所述產生用 圖像是所述正像還是所述負像的正確答案標簽產生所述識別器。
2.根據權利要求1的學習裝置,還包括共享碼本存儲部件,被構造為存儲共享碼本,所述共享碼本包括碼本,按照與用于標識所述產生用特征量的標識符相關的方式保持多個所述產生用特 征量的每一個,以及共享信息,是針對用于識別不同的待識別對象的每一個的每個識別器建立的多個共享 信息,并且還包括所述多個產生用特征量中的、在計算所述整體特征量時使用的所述產生 用特征量的所述標識符;其中,所述整體特征量計算部件使用保持在所述碼本中的所述多個產生用特征量中 的、與包括在針對由所述識別器產生部件產生的所述識別器創(chuàng)建的所述共享信息中的標識 符相關的產生用特征量計算所述整體特征量。
3.根據權利要求2的學習裝置,其中,所述多個共享信息中的預定的共享信息具有與 包括在其它共享信息中的所述標識符相同的標識符。
4.根據權利要求3的學習裝置,其中,所述預定的共享信息具有還與從作為正像的模 型圖像提取的特征點相關的所述標識符;并且其中,所述整體特征量計算部件使用與所述標識符相關的產生用特征量和存在于 所述產生用圖像上的整體范圍中的、基于與所述標識符相關的所述特征點確定的范圍上的 特征點的特征點特征量計算所述整體特征量。
5.根據權利要求4的學習裝置,其中,包括在所述預定的共享信息中的所述標識符與 不同于下列特征點的特征點相關,所述特征點相關于與包括在所述其它共享信息中的所述標識符相同的標識符。
6.根據權利要求5的學習裝置,還包括模型圖像特征點提取部件,被構造為從作為正像的模型圖像提取特征點;以及量化部件,被構造為基于所述模型圖像的特征點中的頻率分布對所述特征點進行量化;其中,所述共享信息具有與量化后的所述特征點相關的所述標識符。
7.根據權利要求1的學習裝置,其中,所述整體特征量計算部件計算表示包括在所述 共享碼本中的所述產生用特征量與所述產生用圖像的所述特征點特征量之間的相關的相 關值作為所述整體特征量。
8.根據權利要求1的學習裝置,其中,所述識別器產生部件產生所述識別器和表示減 小所述誤差值的所述維度特征量的維度的維度信息,所述識別器用于使用在多個維度特征 量中的、減小表示所述正像和所述負像的識別錯誤的程度的誤差值的所述維度特征量來執(zhí) 行識別,所述多個維度特征量是由多個維度矢量表示的所述整體特征量的每個維度要素。
9.一種學習用于識別預定的待識別對象的識別器的學習裝置的學習方法,所述學習裝 置包括特征點提取部件, 特征點特征量提取部件, 整體特征量計算部件,以及 識別器產生部件, 所述學習方法包括如下步驟通過所述特征點提取部件,從多個產生用圖像的每個提取特征點,所述產生用圖像用 于產生識別存在于圖像上的被攝體是否是預定的待識別對象的識別器,并且所述產生用圖 像由存在所述待識別對象的正像和不存在所述待識別對象的負像組成;通過所述特征點特征量提取部件,從所述產生用圖像提取表示所述特征點的特征的特 征點特征量;通過所述整體特征量計算部件,基于共享碼本從所述產生用圖像的所述特征點特征量 計算表示所述產生用圖像的整體特征的整體特征量,所述共享碼本包括共同用于產生識別 不同的待識別對象的每一個的識別器的產生用特征量;以及通過所述識別器產生部件,基于所述產生用圖像的所述整體特征量和表示所述產生用 圖像是所述正像還是所述負像的正確答案標簽產生所述識別器。
10.一種程序,使得計算機充當以下部件特征點提取部件,被構造為從多個產生用圖像的每一個提取特征點,所述產生用圖像 用于產生識別存在于圖像上的被攝體是否是預定的待識別對象的識別器,并且所述產生用 圖像由存在所述待識別對象的正像和不存在所述待識別對象的負像組成;特征點特征量提取部件,被構造為從所述產生用圖像提取表示所述特征點的特征的特 征點特征量;整體特征量計算部件,被構造為基于共享碼本從所述產生用圖像的所述特征點特征量 計算表示所述產生用圖像的整體特征的整體特征量,所述共享碼本包括共同用于產生識別 不同的待識別對象的每一個的識別器的產生用特征量;以及識別器產生部件,被構造為基于所述產生用圖像的所述整體特征量和表示所述產生用 圖像是所述正像還是所述負像的正確答案標簽產生所述識別器。
11.一種識別裝置,包括特征點提取部件,被構造為從待處理圖像提取特征點,所述待處理圖像用作用于識別 存在于圖像上的被攝體是否是預定的待識別對象的處理對象;特征點特征量提取部件,被構造為從所述待處理圖像提取表示所述特征點的特征的特 征點特征量;整體特征量計算部件,被構造為基于共享碼本從所述待處理圖像的特征點特征量計算 表示所述待處理圖像的整體特征的整體特征量,所述共享碼本包括共同用于產生用于識別不同的待識別對象的每一個的識別器的產生用特征量;以及識別部件,被構造為基于用于識別存在于圖像上的被攝體是否是預定的待識別對象的 識別器和所述整體特征量識別存在于所述待處理圖像上的被攝體是否是預定的待識別對象。
12.根據權利要求11的識別裝置,還包括共享碼本存儲部件,被構造為存儲共享碼本,所述共享碼本包括碼本,按照與用于標識所述產生用特征量的標識符相關的方式保持多個所述產生用特 征量的每一個,以及共享信息,是針對用于識別不同的待識別對象的每一個的每個識別器建立的多個共享 信息,并且還包括所述多個產生用特征量中的、在計算所述整體特征量時使用的所述產生 用特征量的所述標識符;其中,所述整體特征量計算部件使用保持在所述碼本中的所述多個產生用特征量中 的、與包括在針對由所述標識部件使用的所述識別器創(chuàng)建的所述共享信息中的所述標識符 相關的產生用特征量計算所述整體特征量。
13.根據權利要求12的識別裝置,其中,所述多個共享信息中的預定的共享信息具有 與包括在其它共享信息中的所述標識符相同的標識符。
14.根據權利要求13的識別裝置,其中,所述預定的共享信息具有還與從存在所述預 定的待識別對象的模型圖像提取的特征點相關的所述標識符;并且其中,所述整體特征量計算部件使用與所述標識符相關的產生用特征量和存在于 所述待處理圖像上的整體范圍中的、基于與所述標識符相關的所述特征點確定的范圍上的 特征點的特征點特征量計算所述整體特征量。
15.根據權利要求14的識別裝置,其中,包括在所述共享信息中的所述標識符與不同 于下列特征點的特征點相關,所述特征點相關于與包括在所述其它共享信息中的所述標識符相同的標識符。
16.根據權利要求11的識別裝置,其中,所述整體特征量計算部件計算表示包括在所 述共享碼本中的所述產生用特征量與所述待處理圖像的所述特征點特征量之間的相關的 相關值作為所述整體特征量。
17.根據權利要求11的識別裝置,其中,所述整體特征量計算部件基于所述共享碼本, 從所述待處理圖像的特征點特征量計算表示所述待處理圖像的整體特征的、由多個維度特 征量組成的整體特征量;并且其中,所述識別部件通過將組成所述整體特征量的所述多個維度特征量中的預定 維度特征量提供給識別存在于圖像上的被攝體是否是預定的待識別對象的識別器作為輸 入,識別存在于所述待處理圖像上的被攝體是否是預定的待識別對象。
18.根據權利要求17的識別裝置,其中,所述識別部件將組成所述整體特征量的所述 多個維度特征量中的、維度信息所表示的維度的維度特征量提供給用于識別存在于圖像上 的被攝體是否是預定的待識別對象的識別器作為輸入,從而識別在所述圖像上出現的被攝 體是否是預定的待識別對象;并且其中,所述識別器使用表示所述整體特征量的所述多個維度特征量中的、減小誤 差值的所述維度特征量執(zhí)行識別,所述誤差值表示對于是所述待識別對象存在于圖像上的正像還是所述待識別對象不存在于圖像上的負像的識別錯誤的程度;并且其中,所述維度信息表示減小所述誤差值的所述維度特征量的維度。
19.一種識別在圖像上出現的被攝體是否是預定的待識別對象的識別裝置的識別方 法,所述識別裝置包括特征點提取部件, 特征點特征量提取部件, 整體特征量計算部件,以及 識別部件,所述識別方法包括如下步驟通過所述特征點提取部件,從作為用于識別存在于圖像上的被攝體是否是預定的待識 別對象的處理對象的待處理圖像提取特征點;通過所述特征點特征量提取部件,從所述待處理圖像提取表示所述特征點的特征的特 征點特征量;通過所述整體特征量計算部件,基于共享碼本從所述待處理圖像的特征點特征量計算 表示所述待處理圖像的整體特征的整體特征量,所述共享碼本包括共同用于產生用于識別 不同的待識別對象的每一個的識別器的產生用特征量;以及通過所述識別部件,基于用于識別存在于圖像上的被攝體是否是預定的待識別對象的 識別器和所述整體特征量來識別存在于所述待處理圖像上的被攝體是否是預定的待識別 對象。
20.一種程序,使得計算機充當以下部件特征點提取部件,被構造為從待處理圖像提取特征點,所述待處理圖像作為用于識別 存在于圖像上的被攝體是否是預定的待識別對象的處理對象;特征點特征量提取部件,被構造為從所述待處理圖像提取表示所述特征點的特征的特 征點特征量;整體特征量計算部件,被構造為基于共享碼本從所述待處理圖像的特征點特征量計算 表示所述待處理圖像的整體特征的整體特征量,所述共享碼本包括共同用于產生用于識別 不同的待識別對象的每一個的識別器的產生用特征量;以及識別部件,被構造為基于用于識別存在于圖像上的被攝體是否是預定的待識別對象的 識別器和所述整體特征量識別存在于所述待處理圖像上的被攝體是否是預定的待識別對 象。
21.一種學習裝置,包括特征點提取單元,被構造為從多個產生用圖像的每一個提取特征點,所述產生用圖像 用于產生識別存在于圖像上的被攝體是否是預定的待識別對象的識別器,并且所述產生用 圖像由存在所述待識別對象的正像和不存在所述待識別對象的負像組成;特征點特征量提取單元,被構造為從所述產生用圖像提取表示所述特征點的特征的特 征點特征量;整體特征量計算單元,被構造為基于共享碼本從所述產生用圖像的所述特征點特征量 計算表示所述產生用圖像的整體特征的整體特征量,所述共享碼本包括共同用于產生識別 不同的待識別對象的每一個的識別器的產生用特征量;以及識別器產生單元,被構造為基于所述產生用圖像的所述整體特征量和表示所述產生用 圖像是所述正像還是所述負像的正確答案標簽產生所述識別器。
22. —種識別裝置,包括特征點提取單元,被構造為從待處理圖像提取特征點,所述待處理圖像作為用于識別 存在于圖像上的被攝體是否是預定的待識別對象的處理對象;特征點特征量提取單元,被構造為從所述待處理圖像提取表示所述特征點的特征的特 征點特征量;整體特征量計算單元,被構造為基于共享碼本從所述待處理圖像的特征點特征量計算 表示所述待處理圖像的整體特征的整體特征量,所述共享碼本包括共同用于產生用于識別 不同的待識別對象的每一個的識別器的產生用特征量;以及識別單元,被構造為基于用于識別存在于圖像上的被攝體是否是預定的待識別對象的 識別器和所述整體特征量,識別存在于所述待處理圖像上的被攝體是否是預定的待識別對 象。
全文摘要
本發(fā)明涉及學習裝置、學習方法、識別裝置、識別方法和程序。本發(fā)明提供了一種學習裝置,包括特征點提取單元,從多個產生用圖像的每一個提取特征點;特征點特征量提取單元,從產生用圖像提取表示特征點的特征的特征點特征量;整體特征量計算單元,基于共享碼本從產生用圖像的特征點特征量計算表示產生用圖像的整體特征的整體特征量,所述共享碼本包括共同用于產生用于識別不同的識別對象的每一個的識別器的產生用特征量;以及識別器產生單元,基于產生用圖像的整體特征量和表示產生用圖像是正像還是負像的正確答案標簽產生識別器。
文檔編號G06K9/64GK102147868SQ20101059952
公開日2011年8月10日 申請日期2010年12月22日 優(yōu)先權日2010年1月27日
發(fā)明者巖井嘉昭, 本間俊一, 蘆原隆之 申請人:索尼公司